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vant-propos 


Cette neuvième édition est enrichie de nouveaux exercices et des développe- 
ments les plus récents de l’économétrie. Ce livre couvre tous les champs de 
l’économétrie : régression simple et multiple, violation des hypothèses (hété- 
roscédasticité, autocorrélation des erreurs, variables explicatives aléatoires), 
modèle à décalage, analyse des séries temporelles, tests de racine unitaire, équa- 
ons multiples, VAR, cointégration, VECM, économétrie des variables qualita- 
tives et des données de panel... 

Sur l’ensemble de ces thèmes, ce livre vous propose un cours, des exercices cor- 
rigés, et une présentation des logiciels d’économétrie les plus répandus. 
Souhaitons qu’il corresponde à votre attente. 


En effet, nous avons voulu, par une alternance systématique de cours et 
d'exercices, répondre à un besoin pédagogique qui est de mettre rapidement en 
pratique les connaissances théoriques et ainsi, d’utiliser de manière opération- 
nelle les acquis du cours ; les exercices sont repérés grâce à un bandeau grisé. 
De surcroît, le recours à des logiciels!, lors de la résolution des exercices, per- 
met une découverte de ces outils et donne une dimension pratique que recher- 
chent l’étudiant et le praticien. 


Afin que le lecteur puisse lui-même refaire les exercices, les données utili- 
sées (sous format Excel, ASCII RATS et Eviews) ainsi que les programmes de 
traitement « Batch » de Eviews ou de RATS sont disponibles gratuitement par 
téléchargement sur le serveur web : 


http://regisbourbonnais.dauphine.fr 


Pour chaque exercice faisant appel à un fichier de données, le nom du fichier 
est cité en tête de l’exercice et repéré par l’icône suivante : LL. 


Nous avons voulu faire de ce manuel un livre d’apprentissage facilement 
accessible ; c’est pourquoi les démonstrations les plus complexes font l’objet de 
renvois à une bibliographie plus spécialisée. Cependant, il convient de préciser 
que l’économétrie fait appel à des notions d’algèbre linéaire et d’induction sta- 
tistique qu’il est souhaitable de connaître. 


1. Trois logiciels sont utilisés : EXCEL (© Microsoft), RATS (© Var Econometrics version 3 et 
Estima version 4), Eviews (© Quantitative Micro Software). Nous recommandons aussi parti- 
culièrement le logiciel GRETL (http://gretl.sourceforge.net) qui est un logiciel d’économétrie 
gratuit, complet et très facile d’apprentissage. 
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Dans le terme « économétrie » figure la racine du mot « économie » car son 
utilisation est surtout destinée à des fins de traitement de données économiques ; 
cependant, d’autres domaines tels que la finance, la recherche agronomique, la 
médecine, etc., font maintenant le plus souvent appel à ces techniques. 


Ce livre s’adresse en premier lieu aux étudiants (sciences économiques, ges- 
tion, écoles de commerce et d’ingénieurs, etc.) dont la formation requiert une 
connaissance de l’économétrie. Gageons qu’il sera un support de cours indis- 
pensable et un allié précieux pour préparer les séances de travaux dirigés. 


N'oublions pas cependant le praticien de l’économétrie (économiste d’entre- 
prise, chercheur, etc.) qui, confronté à des problèmes d’estimation statistique, 
trouvera dans ce livre les réponses pratiques aux différentes questions qu’il peut 
se poser. 


Enfin, j’exprime toute ma gratitude à toutes les personnes — collègues et étu- 
diants — qui ont eu la gentillesse de me faire des commentaires et dont les 
conseils et suggestions contribuent à la qualité pédagogique de ce livre. Je reste, 
bien entendu, le seul responsable des erreurs qui subsisteraient!. 


1. Les lecteurs souhaitant faire des commentaires ou des remarques peuvent me contacter : Régis 
Bourbonnais, université de Paris-Dauphine, place du Maréchal de Lattre de Tassigny, 75775 
Paris Cedex 16, E-mail : regis.bourbonnais @ dauphine.fr 
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u'est-ce que 
l'économétrie ? 


e premier chapitre est consacré à la présentation de l'économétrie 

et à sa liaison avec la théorie économique. Nous abordons tout 

d'abord la notion de modèle ainsi que les différentes étapes de la 
modélisation. L'apport de l'économétrie en tant qu'outil de validation 
est étudié en Il. Enfin, la théorie de la corrélation - fondement de l'éco- 
nométrie — fait l'objet de la section III. 


a notion de modèle 


éfinition 


Il est délicat de fournir une définition unique de la notion de modèle!. Dans le 
cadre de l’économétrie, nous pouvons considérer qu’un modèle consiste en une 
présentation formalisée d’un phénomène sous forme d’équations dont les 
variables sont des grandeurs économiques. L'objectif du modèle est de repré- 
senter les traits les plus marquants d’une réalité qu’il cherche à styliser. Le 
modèle est donc l’outil que le modélisateur utilise lorsqu'il cherche à com- 
prendre et à expliquer des phénomènes. Pour ce faire, il émet des hypothèses et 
explicite des relations. 


1. La notion de modèle est relative au point de vue auquel nous nous plaçons : la physique, 
l’épistémologie. 
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Pourquoi des modèles ? 


Nombreux sont ceux — sociologues, économistes ou physiciens — qui 
fondent leurs analyses ou leurs jugements sur des raisonnements 
construits et élaborés. Ces constructions refèrent implicitement à des 
modèles ; alors pourquoi ne pas expliciter clairement les hypothèses et 
les relations au sein d’un modèle ? 


Le modèle est donc une présentation schématique et partielle d’une réalité 
naturellement plus complexe. Toute la difficulté de la modélisation consiste à ne 
retenir que la ou les représentations intéressantes pour le problème que le modé- 
lisateur cherche à expliciter. Ce choix dépend de la nature du problème, du type 
de décision ou de l’étude à effectuer. La même réalité peut ainsi être formalisée 
de diverses manières en fonction des objectifs. 


a construction des modèles en économétrie 


Dans les sciences sociales, et particulièrement en économie, les phénomènes 
étudiés concernent le plus souvent des comportements afin de mieux com- 
prendre la nature et le fonctionnement des systèmes économiques. L'objectif du 
modélisateur est, dans le cadre de l’économétrie et au travers d’une mesure sta- 
tistique, de permettre aux agents économiques (ménages, entreprises, État...) 
d’intervenir de manière plus efficace. La construction d’un modèle comporte un 
certain nombre d’étapes qui sont toutes importantes. En effet, en cas de faibles- 
se d’un des « maillons », le modèle peut se trouver invalidé pour cause d’hypo- 
thèses manquantes, de données non représentatives ou observées avec des 
erreurs, etc. Examinons les différentes étapes à suivre lors de la construction 
d’un modèle, ceci à partir de l’exemple du modèle keynésien simplifié. 


1) Référence à une théorie 


Une théorie s’exprime au travers d’hypothèses auxquelles le modèle fait réfé- 
rence. Dans la théorie keynésienne, quatre propositions sont fondamentales : 


1. la consommation et le revenu sont liés ; 
2. le niveau d’investissement privé et le taux d’intérêt sont également liés ; 
3. il existe un investissement autonome public ; 


4. enfin, le produit national est égal à la consommation plus l’investissement 
privé et public. 
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2) Formalisation des relations et choix de la forme des fonctions 


À partir des propositions précédentes, nous pouvons construire des relations : 
1. la consommation est fonction du revenu : C = f(Y) avec f' > 0 ; 
2. l'investissement privé dépend du taux d’intérêt : Z = g(r) avec g' <0 ; 
3. il existe un investissement autonome public : Z ; 


4. enfin, le produit national (ou le revenu national) est égal à la consomma- 

tion plus l’investissement : Y =C+1+1I. 

À ce stade, nous n’avons postulé aucune forme particulière en ce qui concer- 
ne les fonctions f et g. Ainsi, bien que des considérations d’ordre théorique nous 
renseignent sur le signe des dérivées, il existe une multitude de fonctions de 
formes très différentes et ayant des signes de dérivées identiques, par exemple 
C=a&+aY et C = a Y“'. Cependant ces deux relations ne reflètent pas le 
même comportement ; une augmentation du revenu provoque un accroissement 
proportionnel pour la première relation, alors que, dans la seconde, l’effet s’es- 
tompe avec l’augmentation du revenu (si 0 < a, < 1). Nous appelons « forme 
fonctionnelle » ce choix (arbitraire ou fondé) de spécification précise du modè- 
le. Dans notre exemple, le modèle explicité s’écrit : 


C=a+aY avec a -0et0<a <1 
a; = propension marginale à consommer 
et a — Consommation incompressible ; 


T=b+bir avec b, > O0 et, <0; 
Y=C+I+I 


Les deux premières équations reflètent des relations de comportements alors 
que la troisième est une identité (aucun paramètre n’est à estimer). 


3) Sélection et mesure des variables 


Le modèle étant spécifié, il convient de collecter les variables représentatives 
des phénomènes économiques. Ce choix n’est pas neutre et peut conduire à des 
résultats différents, les questions qu’il convient de se poser sont par exemple : 


— Faut-il raisonner en euros constants ou en euros courants ? 
— Les données sont-elles brutes ou CVS! ? 


— Quel taux d'intérêt faut-il retenir (taux au jour le jour, taux directeur de la 
Banque Centrale Européenne...) ? etc. 


1. Corrigées des Variations Saisonnières. 
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Nous distinguons plusieurs types de données selon que le modèle est spéci- 
fié en : 
— série temporelle : c’est le cas le plus fréquent en économétrie, il s’agit de 


variables observées à intervalles de temps réguliers (la consommation 
annuelle, totale France, exprimée en euros courants sur 20 ans) ; 


— coupe instantanée : les données sont observées au même instant et concer- 
nent les valeurs prises par la variable pour un groupe d’individus! spéci- 
fiques (consommation observée des agriculteurs pour une année donnée) ; 


— panel : la variable représente les valeurs prises par un échantillon d’indivi- 
dus à intervalles réguliers (la consommation d’un échantillon de ménages 
de la région parisienne sur 20 ans) ; 


— cohorte : très proches des données de panel, les données de cohorte se dis- 
tinguent de la précédente par la constance de l’échantillon, les individus 
sondés sont les mêmes d’une période sur l’autre. 


4) Décalages temporels 


Dans le cadre de modèle spécifié en séries temporelles, les relations entre les 
variables ne sont pas toujours synchrones mais peuvent être décalées dans le 
temps. Nous pouvons concevoir que la consommation de l’année f est expliquée 
par le revenu de l’année # — 1 et non celui de l’année r. Pour lever cette ambi- 
guïté, il est d’usage d’écrire le modèle en le spécifiant à l’aide d’un indice 
de temps : C; = a + ai Y,_1. La variable Y, , est appelée « variable endogène 
retardée ». 


On appelle « variable exogène » une variable dont les valeurs sont pré- 
déterminées, et « variable endogène » une variable dont les valeurs 
dépendent des variables exogènes. 


5) Validation du modèle 


La dernière étape est celle de la validation? du modèle : 
— Les relations spécifiées sont-elles valides ? 
— Peut-on estimer avec suffisamment de précision les coefficients ? 
— Le modèle est-il vérifié sur la totalité de la période ? 
— Les coefficients sont-ils stables ? Etc. 


À toutes ces questions, les techniques économétriques s’efforcent d’apporter 
des réponses. 


1. Le terme d’individu est employé au sens statistique, c’est-à-dire comme un élément d’une popu- 
lation : une personne, une parcelle de terre... 


2. Validation, c’est-à-dire en conformité avec les données disponibles. 
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e rôle de l'économétrie 


économétrie comme validation de la théorie 


L’économétrie est un outil à la disposition de l’économiste qui lui permet d’in- 
firmer ou de confirmer les théories qu’il construit. Le théoricien postule des 
relations ; l’application de méthodes économétriques fournit des estimations sur 
la valeur des coefficients ainsi que la précision attendue. 


Une question se pose alors : pourquoi estimer ces relations, et les tester 
statistiquement ? Plusieurs raisons incitent à cette démarche : tout d’abord cela 
force l’individu à établir clairement et à estimer les interrelations sous-jacentes. 
Ensuite, la confiance aveugle dans l’intuition peut mener à l’ignorance de 
liaisons importantes ou à leur mauvaise utilisation. De plus, des relations mar- 
ginales mais néanmoins explicatives, qui ne sont qu’un élément d’un modèle 
global, doivent être testées et validées afin de les mettre à leur véritable place. 
Enfin, il est nécessaire de fournir, en même temps que l’estimation des relations, 
une mesure de la confiance que l’économiste peut avoir en celles-ci, c’est-à-dire 
la précision que l’on peut en attendre. Là encore, l’utilisation de méthodes pure- 
ment qualitatives exclut toute mesure quantitative de la fiabilité d’une relation. 


économétrie comme outil d'investigation 


L’économétrie n’est pas seulement un système de validation, mais également un 
outil d’analyse. Nous pouvons citer quelques domaines où l’économétrie appor- 
te une aide à la modélisation, à la réflexion théorique ou à l’action économique 
par : 


—la mise en évidence de relations entre des variables économiques qui 
n'étaient pas a priori évidentes ou pressenties ; 


— l'induction statistique ou l’inférence statistique consiste à inférer, à partir 
des caractéristiques d’un échantillon, les caractéristiques d’une population. 
Elle permet de déterminer des intervalles de confiance pour des paramètres 
du modèle ou de tester si un paramètre est significativement! inférieur, 
supérieur ou simplement différent d’une valeur fixée ; 


1. Au sens statistique, c’est-à-dire avec un seuil (risque d’erreur à ne pas dépasser, souvent 5 %). 
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— la simulation qui mesure l’impact de la modification de la valeur d’une 
variable sur une autre (AC, = a; AY,) ; 


— la prévision! par l’utilisation de modèles économétriques, qui est utilisée 
par les pouvoirs publics ou l’entreprise afin d’anticiper et éventuellement 
de réagir à l’environnement économique. 


Dans cet ouvrage, nous nous efforcerons de montrer, à l’aide d'exemples, les 
différentes facettes de l’utilisation des techniques économétriques dans des 
contextes et pour des objectifs différents. 


à théorie de la corrélation 


résentation générale 


Lorsque deux phénomènes ont une évolution commune, nous disons qu’ils sont 
« corrélés ». La corrélation simple mesure le degré de liaison existant entre ces 
deux phénomènes représentés par des variables. Si nous cherchons une relation 
entre trois variables ou plus, nous ferons appel alors à la notion de corrélation 
multiple. 


Nous pouvons distinguer la corrélation linéaire, lorsque tous les points du 
couple de valeurs (x,y) des deux variables semblent alignés sur une droite, de 
la corrélation non linéaire lorsque le couple de valeurs se trouve sur une même 
courbe d’allure quelconque. 


Deux variables peuvent être : 


— en corrélation positive ; on constate alors une augmentation (ou diminu- 
tion, ou constance) simultanée des valeurs des deux variables ; 


— en corrélation négative, lorsque les valeurs de l’une augmentent, les valeurs 
de l’autre diminuent ; 


— non corrélées, il n’y a aucune relation entre les variations des valeurs de 
l’une des variables et les valeurs de l’autre. 


Le tableau 1, en croisant les critères de linéarité et de corrélation, renvoie à 
une représentation graphique. 


1. Pour découvrir l’utilisation de l’économétrie à des fins de prévision de ventes, voir Bourbonnais 
R. et Usunier J. C. (2013). 
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Tableau 1 - Linéarité et corrélation 


Corrélation Corrélation Absence de 
positive négative corrélation 
Relation linéaire Graphe 1 Graphe 2 Graphe 5 
Relation non linéaire Graphe 3 Graphe 4 Graphe 5 
y # 
x X 
Graphe 1 Graphe 2 
y 


Graphe 3 Graphe 4 
Y| 5 
. 
CL] 5 * 
Li 
L & C1 . : 
Ÿ | 
_ ” 


Graphe 5 
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esure et limite du coefficient de corrélation 


1) Le coefficient de corrélation linéaire 


La représentation graphique ne donne qu’une « impression » de la corrélation 
entre deux variables sans donner une idée précise de l’intensité de la liaison, 
c’est pourquoi nous calculons une statistique appelée coefficient de corrélation 
linéaire simple, noté r,,. Il est égal à : 


GG 5) 
Cov (x,y) i=1 
= — [1] 
(of Oy n _: n ne 
JE - mr Èc —5Ÿ 
i=1 i=1 
avec : 
Cov (x,y) = covariance entre x et y ; 
o eto, — écart type de x et écart type de y ; 
n — nombre d'observations. 
En développant la formule [1], il vient : 
nm) x) 
i=1 i=] i=1 
rx, [21 


n n 


pe ET Er 5) 


i= = i=1 


On peut démontrer que, par construction ce coefficient reste compris entre 
—let1: 


— proche de 1, les variables sont corrélées positivement ; 
— proche de —1, les variables sont corrélées négativement ; 
— proche de 0, les variables ne sont pas corrélées. 


Dans la pratique, ce coefficient est rarement très proche de l’une de ces trois 
bornes et il est donc difficile de proposer une interprétation fiable à la simple 
lecture de ce coefficient. Ceci est surtout vrai en économie où les variables sont 
toutes plus au moins liées entre elles. De plus, il n’est calculé qu’à partir d’un 
échantillon d’observations et non pas sur l’ensemble des valeurs. On appelle »,., 
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ce coefficient empirique qui est une estimation du coefficient vrai r,,. La théo- 
rie des tests statistiques nous permet de lever cette indétermination. 


Soit à tester l'hypothèse H0 : ,, = 0, contre l’hypothèse H1 : r,, # 0. 
Px,y 


(1 - PE) 
n —2 
de Student à n — 2 degrés de liberté!. Nous calculons alors une statistique, appe- 
lé le r de Student empirique : 


Sous l’hypothèse HO, nous pouvons démontrer que suit une loi 


Le s 
(1 De p2?.) 
n—2 


Si r* > 1*/ valeur lue dans une table de Student? au seuil & = 0,05 (5 %) à 


n — 2 degrés de liberté?, nous rejetons l’hypothèse HO, le coefficient de corréla- 
tion est donc significativement différent de O ; dans le cas contraire, l’hypothè- 
se d’un coefficient de corrélation nul est acceptée. La loi de Student étant symé- 
trique, nous calculons la valeur absolue du empirique et nous procédons au test 
par comparaison avec la valeur lue directement dans la table. 


1. La notion de degrés de liberté est explicitée au chapitre 2. 
2. Les lois de probabilité sont en fin d'ouvrage. 


3. Si le nombre d’observations n est supérieur à 30, on peut approximer la loi de Student par une 
loi normale, soit */2 & 1,96. 
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Exercice n° 1 


LL, fichier C1EX1 


Calcul d’un coefficient de corrélation 


Un agronome s'intéresse à la liaison pouvant exister entre le rendement de maïs x 
(en quintal) d’une parcelle de terre et la quantité d’engrais y (en kilo). Il relève 10 cou- 


ples de données consignés dans le tableau 2 


Tableau 2 — Rendement de maïs et quantité d'engrais 


Rendement x 16 18 23 24 28 29 26 


31 


32 


34 


Engrais y 20 24 28 22 32 | 28 32 


36 


41 


41 


1) Tracer le nuage de points et le commenter. 


2) Calculer le coefficient de corrélation simple et tester sa signification par rapport à 0 


pour un seuil & = 0,05. 


Solution 


1) Le nuage de points (graphique 6) indique que les couples de valeurs sont approxima- 


tivement alignés : les deux variables semblent corrélées positivement. 


Quantité d'engrais 
+ Qi Le 
DéRkwes 
l 


16 18 23 24 28 2q 2 41 
Rendement 


Graphique 6 - Nuage du couple de valeurs : 
rendement-quantité d'engrais 
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2) Afin d’appliquer la formule [2], nous dressons le tableau de calcul 3. 


Tableau 3 -— Calcul d’un coefficient de corrélation 


x y ne y? xy 
16 20 256 400 320 
18 24 324 576 432 
23 28 529 784 644 
24 22. 576 484 528 
28 32 784 1 024 896 
29 28 841 784 812 
26 32 676 1 024 832 
31 36 961 1 296 1116 
32 41 1 024 1 681 1312 
34 41 1 156 1 681 1 394 
Somme 261 304 7127 9 734 8 286 
(10)(8 286) — (261)(304) 3516 


La Va0t712n — 2612 (1010734 304  (56,11)(70,17) 


soit px, = 0,89 et Des = 0,79 
Le t de Student empirique (d’après [3]) est égal à : 


Ipsl 0,89 


n —2 


1 = 


= 5,49 > 1905 = 2,306 


le coefficient de corrélation entre x et y est significativement différent de 0. 


2) Limites de la notion de corrélation 


a) La relation testée est linéaire 


L'application de la formule [1] ou [2] ne permet de déterminer que des corréla- 
tions linéaires entre variables. Un coefficient de corrélation nul indique que la 
covariance entre la variable x et la variable y est égale à 0. C’est ainsi que deux 
variables en totale dépendance peuvent avoir un coefficient de corrélation nul, 
comme l’illustre l’exemple suivant : l’équation d’un cercle nous est donnée 
par (x — x)? + (y — y.) = R?, les variables x et y sont bien liées entre elles 
fonctionnellement (graphique 7) et pourtant leur covariance est nulle et donc 
leur coefficient de corrélation égal à 0. 

Pour pallier cette limite, il convient éventuellement de transformer les 
variables, préalablement au calcul du coefficient de corrélation, afin de linéariser 
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leur relation, par exemple au moyen d’une transformation de type logarith- 
mique. 


Graphique 7 — Relation fonctionnelle n’est pas corrélation linéaire 


b) Corrélation n’est pas causalité 


Le fait d’avoir un coefficient de corrélation élevé entre deux variables ne signi- 
fie pas qu’il existe un autre lien que statistique. En d’autres termes, une cova- 
riance significativement différente de 0 n’implique pas une liaison d’ordre éco- 
nomique, physique ou autre. Nous appelons corrélation fortuite ce type de cor- 
rélation que rien ne peut expliquer. 

L'exemple le plus fameux concerne la forte corrélation existante entre le 
nombre de taches solaires observées et le taux de criminalité aux États-Unis. 
Cela ne signifie pas qu’il existe une relation entre les deux variables, mais 
qu’une troisième variable, l’évolution de long terme (la tendance) ici, explique 
conjointement les deux phénomènes. La théorie de la cointégration traite de ce 
problème (cf. chapitre 11). 
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e modèle 
de régression simple 


ous commençons notre étude par le modèle le plus simple : une 
variable endogène est expliquée par une variable exogène. 
Après avoir étudié les conséquences probabilistes de l'erreur 
d'observation, nous présentons en I. les formules de base permettant 
d'estimer les paramètres du modèle. Les hypothèses stochastiques et 
leurs conséquences sont étudiées au paragraphe II. 
En Ill. et IV. la qualité de l'estimation d'un modèle est examinée à l'aide 
des premiers tests statistiques (Student, Fisher). 
Enfin, en V., le modèle de régression simple est étudié en tant qu'outil de 
prévision avec le degré de confiance que nous pouvons en attendre. 


résentation du modèle 


xemple introductif 


Soit la fonction de consommation keynésienne : 


C=a&+aY 
Où : 
C = consommation, 
Y — revenu, 
a —= propension marginale à consommer, 
& — Consommation autonome ou incompressible. 
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1) Vocabulaire 


+ La variable consommation est appelée « variable à expliquer » ou « variable 
endogène ». 


+ La variable revenu est appelée « variable explicative » ou « variable exogène » 
(c’est le revenu qui explique la consommation). 


*° a, et a sont les paramètres du modèle ou encore les coefficients de régression. 


2) Spécification 


Nous pouvons distinguer deux types de spécifications : 


* Les modèles en série temporelle, les variables représentent des phénomènes 
observés à intervalles de temps réguliers, par exemple la consommation et le 
revenu annuel sur 20 ans pour un pays donné. Le modèle s’écrit alors : 


C, = a) + a; Ÿ, t—1,...,20 


© 
C2 


= consommation au temps f, 
— revenu au temps f. 


KO 


+ Les modèles en coupe instantanée, les variables représentent des phénomènes 
observés au même instant mais concernant plusieurs individus, par exemple la 
consommation et le revenu observés sur un échantillon de 20 pays. Le modèle 
s’écrit alors : 


Ci = &o + &i Y; = 1;::::20 
où : 
; = consommation du pays i pour une année donnée, 
Y;, — revenu du pays à pour une année donnée. 


ôle du terme aléatoire 


Le modèle tel qu’il vient d’être spécifié n’est qu’une caricature de la réalité. 
En effet ne retenir que le revenu pour expliquer la consommation est à l’évi- 
dence même insuffisant ; il existe une multitude d’autres facteurs susceptibles 
d'expliquer la consommation. C’est pourquoi nous ajoutons un terme (e,) 
qui synthétise l’ensemble de ces informations non explicitées dans le mo- 
dèle: C;=a+æaY;+e, si le modèle est spécifié en série temporelle 
(C; = do+ & Y, +8, sile modèle est spécifié en coupe instantanée), où &, repré- 
sente l’erreur de spécification du modèle, c’est-à-dire l’ensemble des phéno- 
mènes explicatifs de la consommation non liés au revenu. Le terme &, mesure la 
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différence entre les valeurs réellement observées de C,; et les valeurs qui auraient 
été observées si la relation spécifiée avait été rigoureusement exacte. Le terme 
8, regroupe donc trois erreurs : 


— une erreur de spécification, c’est-à-dire le fait que la seule variable expli- 
cative n’est pas suffisante pour rendre compte de la totalité du phénomè- 
ne expliqué ; 

— une erreur de mesure, les données ne représentent pas exactement le phé- 
nomène ; 


— une erreur de fluctuation d’échantillonnage, d’un échantillon à l’autre les 
observations, et donc les estimations, sont légèrement différentes. 


Exercice n° 1 


LŸ: fichier C2EX1 


Génération d’une consommation aléatoire 


Le tableau 1 présente le revenu moyen par habitant sur 10 ans exprimé en dollars 
pour un pays. 


Tableau 1 - Évolution du revenu moyen par habitant en dollars 


Année Revenu 
1 8 000 
2 9 000 
3 9 500 
4 9 500 
S 9 800 
6 11 000 
7 12 000 
8 13 000 
9 15 000 
10 16 000 


Sachant que la propension marginale à consommer est de 0,8 et que la consomma- 
tion incompressible est 1 000, on demande : 


1) de calculer la consommation théorique sur les 10 ans ; 


2) considérant que notre erreur d’observation suit une loi normale de moyenne 0 et de 
variance 20 000, de générer cette variable aléatoire et de calculer une consommation 
observée tenant compte de cette erreur. 


Solution 


Les calculs des questions 1) et 2) sont présentés dans le tableau 2. 


La consommation théorique (colonne 3) est calculée par application directe de la 
formule : C; = 1000 + 0,8 y,. 
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La génération de la variable aléatoire &,(8, — N(0; 20 000)) ne pose pas de diffi- 
culté particulière ; bien entendu il en existe une infinité, un exemple en est présenté en 
colonne 4. 


La consommation « observée » (colonne 5) est donc égale à C; = 1 000 +0,8 Y, +&,, 
soit la somme de la colonne 3 et de la colonne 4. 


Tableau 2 — Calcul de la consommation observée 


(D (2) (3) (4) (5) 
Année Revenu Consommation Aléa Consommation 
disponible théorique & observée 
1 8 000 7 400 — 10,01 7 389,99 
2 9 000 8 200 — 30,35 8 169,65 
3 9 500 8 600 231,71 8 831,71 
4 9 500 8 600 52,84 8 652,84 
5 9 800 8 840 — 51,92 8 788,08 
6 11 000 9 800 — 183,79 9 616,21 
7 12 000 10 600 — 6,55 10 593,45 
8 13 000 11 400 — 213,89 11 186,11 
9 15 000 13 000 — 241,91 12 758,09 
10 16 000 13 800 69,62 13 869,62 
Moyenne : — 38,42 
Écart type : 137,24 


Nous observons que la moyenne de &,, & — —38,42 et la variance de &,, Var(e,) = 
18 834,81 sont légèrement différentes des valeurs théoriques. Cela est la conséquence 
du tirage particulier d’un échantillon de taille assez faible (dix observations). 


onséquences du terme aléatoire 


Dans l’exercice précédent, les valeurs vraies à et a, sont parfaitement connues, 
cependant, dans la réalité, nous ne connaissons pas ces valeurs mais seulement 
les deux séries d’observations C, et R,. Les estimateurs! de a, et a,, notés res- 
pectivement &, et &, sont des variables aléatoires, qui suivent les mêmes lois de 
probabilité, celle de &,, puisqu'ils sont fonctions de la variable aléatoire &,. Les 
caractéristiques de moyenne et d’écart type de ces coefficients permettent de 
construire des tests de validité du modèle estimé. 


1. Il ne faut pas confondre : estimateur & de a et estimation de 4 qui est la valeur particulière de 
l’estimateur pour un échantillon. 
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Si à l’aide d’un programme informatique (, 4, C2EX1.PRG) nous construi- 
sons 150 échantillons de valeurs différentes pour la variable aléatoire 
& — N(0; 20000), nous allons alors trouver 150 estimations de a; légèrement 
différentes entre elles dont la distribution aura la forme de l’histogramme du 
graphique 1. 

Cette distribution a pour moyenne 0,801 et écart type 0,032, nous pouvons 
observer qu’elle est à peu près symétrique par rapport à la moyenne et qu’elle a 
la forme d’une courbe en « cloche » : tous ces éléments suggèrent bien une dis- 
tribution normale de : a; — N(0,801 ; 0,032). Cela est la conséquence directe 
de la normalité des erreurs. 


Fréquence 


O — 1 CL R Or OT 


| T k 
0,72 073 à,740,750.76 0,77 0.78 0,79 0.8 0.81 5,92 0.83 0.8 Q,85 0.85 0,87 Q.68 0.89 0,9 
Coefficient à; 


Luc 
=.) 


Graphique 1 — Histogramme de la distribution de 150 à 


1. Estimation des paramètres 


À. Modèle et hypothèses 


Soit le modèle suivant : 


Y=d+dx+Ee pour f—=1,...,n 
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y.  —= Variable à expliquer au temps f ; 

x, _— Variable explicative au temps r ; 

&,d —= paramètres du modèle ; 

& — erreur de spécification (différence entre le modèle vrai et le modèle 
spécifié), cette erreur est inconnue et restera inconnue ; 

n — nombre d’observations. 

Hypothèses 


+ H1 : le modèle est linéaire en x, (ou en n’importe quelle transformation de x,). 
+ H2 : les valeurs x, sont observées sans erreur (x, non aléatoire). 


°H3: E(e,) = 0, l'espérance mathématique de l’erreur est nulle : en moyenne le 
modèle est bien spécifié et donc l’erreur moyenne est nulle. 


+ H4: E(e?) = 0}, la variance de l’erreur est constante! : le risque de l’amplitu- 
de de l’erreur est le même quelle que soit la période. 


.HS:E(e, 87) = 0 sir 1, les erreurs sont non corrélées (ou encore indépen- 
dantes) : une erreur à l’instant r n’a pas d’influence sur les erreurs sui- 
vantes. 


+ H6 : Cov(x.,6,) = 0, l’erreur est indépendante de la variable explicative. 


ormulation des estimateurs 


En traçant un graphique (2) des couples de données liant le revenu et la consom- 
mation observée, nous obtenons un nuage de points que nous pouvons ajuster à 
l’aide d’une droite. 

L’estimateur des coefficients & et a, est obtenu en minimisant la distance au 
carré entre chaque observation et la droite, d’où le nom d’estimateur des 
moindres carrés ordinaires (MCO). 


La résolution analytique est la suivante : 


=n 


Minÿ € = Min DE — a — ax,) = MinS 
t=1 t=1 


1. Cette hypothèse s’appelle l'hypothèse d’homoscédasticité ; dans le cas où cette hypothèse n’est 
pas vérifiée, on parle alors de modèle hétéroscédastique. 
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Graphique 2 — Ajustement d’un nuage de points par une droite 


En opérant par dérivation par rapport à a, et a, afin de trouver le minimum 


de cette fonction, on obtient les résultats suivants : 


ON 


‘& 
Sommant par rapport à #, il vient : 
2 —% 2 — à vie = 0 
t LS t 
D m-r@-& x = 0 
t Lt 


qu’on appelle les équations normales et qui impliquent que : 


t=n t=n 
D@-DG-7 D xm-nxy 
t=1 t=1 

i=n = t=n 


Ge) Vr-nr 


t=1l t=1l 


1 


ës 
Re nn et D 


[1] 


[21 


1. Nous considérons les conditions du deuxième ordre comme vérifiées car la fonction est convexe. 
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Nous pouvons faire deux remarques : 

— l'écriture du modèle n’est pas neutre ; 

La spécification : y, = ao + a, x, + €, n’est pas équivalente à : 
x, = a, +a;y, +. Dans le premier modèle, x, est la cause de y,, alors que dans 
la deuxième spécification, c’est y, qui est la cause de x;. 

Nous remarquons que : & x &, = p° 
(p = coefficient de corrélation entre x et y) ; 
— le coefficient a, représente la pente de la droite ou encore une propension 
marginale. 


Nous avons : Ay, = 4, Ax, . L'impact d’une variation de x, se mesure direc- 
tement sur y, au travers du coefficient à. 


Cas particulier : modèle sans terme constant 


La théorie économique postule parfois des relations dans lesquelles aç = 0 : 
c’est le cas par exemple pour une fonction de production de produit industriel 
où le facteur de production (unique) nul entraîne une production nulle. 
L’estimation de a, est alors donnée par la formule suivante : 


& = = — [3] 


Nous remarquons qu’il s’agit de l’application de la formule [1] dans laquel- 
le x et y sont nulles. Dans le cas de variables centrées!, c’est donc cette formu- 
le [3] qu’il convient d’employer car le terme constant est nul. 


Exercice n° 2 
LL fichier C2EX2 


Estimation des coefficients de régression 


À partir des données du tableau 2 de l’exercice 1, on demande de calculer les esti- 
mations de &o et &i. 


Solution 


Le tableau 3 présente les calculs à effectuer. 


1. Les données sont centrées lorsque les observations sont centrées sur leur moyenne : (x; — x), 
la somme des données centrées est donc par construction nulle. 


20 e ÉCONOMÉTRIE 


Tableau 3 - Calcul d’un coefficient de régression 


(D) (2) (3) (4) (5) (6) (7) 
l 2 X à eu à XX (5)* (5) (4)* (5) 
1 7 389,99 8 000 | — 2595,59 | - 3280 | 10758 400 | 8513 518 
2 8 169,65 9000 | —- 1 815,93 | — 2 280 5 198 400 | 4 140 300 
3 8 831,71 9 500 | — 1153,87 | — 1 780 3 168 400 | 2053 879 
4 8 652,84 9 500 | — 1 332,74 | — 1 780 3 168 400 | 2 372 268 
5 8 788,08 9 800 | — 1 197,50 | — 1 480 2 190 400 | 1772 292 
6 9 616,21 | 11000 | — 369,37 | — 280 78 400 103 422 
7 10 593,45 | 12 000 607,88 720 518 400 437 670 
8 11 186,11 | 13 000 1 200,54 1 720 2 958 400 | 2 064 920 
9 12 758,09 | 15 000 2 772,52 3720 | 13 838 400 | 10 313 755 
10 13 869,62 | 16 000 3 884,05 4720 | 22278 400 | 18 332 692 
Somme |99 855,75 | 112 800 0 0 64 156 000 | 50 104 729 
Moyenne | 9 985,57 | 11 280 0 0 6415 600 | 5010472 


1=n 


D &-20%-7 


= 50 104 729 
à = =— = = 0,78 
=" 64 156 000 
(x, — x}? 
t=1 
Go = y — &x = 9985,57 — 0,78 x 11 280 = 1 176,08 


Ces estimations sont à comparer aux valeurs vraies (respectivement 0,8 et 1 000), 
les différences importantes en ce qui concerne surtout le terme constant sont imputables 
à l’aléa d’observation qui « perturbe » l’estimation des coefficients. 


es différentes écritures du modèle : 
erreur et résidu 


Le modèle de régression simple peut s’écrire sous deux formes selon qu’il s’agit 
du modèle théorique spécifié par l’économiste ou du modèle estimé à partir d’un 
échantillon. 


+ Modèle théorique spécifié par l’économiste avec &, l’erreur inconnue : 


Yr —= do + dix: + € 


+ Modèle estimé à partir d’un échantillon d’observations : 


Yr = do + dx +e = y. +e, € — résidu 


(Bien noter les « chapeaux » sur les a.) 
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Le résidu observé e, est donc la différence entre les valeurs observées de la 


variable à expliquer et les valeurs ajustées à l’aide des estimations des coeffi- 
cients du modèle ; 


Ou EnCOTE : 


Y = do + dix; 


ropriétés des estimateurs 


Ye = do + dix + Es [4 
Y=d+ax+E 


Fi 
un 
Ou 


[4] — [S] = y, — y = ax, — x) + (e, — €) 


En remplaçant dans la formule [1] de l’estimateur à,, y, — y par son expression, 
on obtient : 


> ù . x)(e, = €) S & = X)e, 
t=1 - t=1 


= ai + [6] 
> Sa x) 
t=1 


dE “ x) 
t=1 


n 
: ; > x 
_ _ _ _ t=1l 
car Eÿ 7) =E D X—Enx—Eenx —Enx = 0 avec x — 
n 
t=] t=1 


- Les estimateurs sont-ils sans biais ? 


(Rappel : un estimateur est sans biais si E(@) = a.) 


6 = X)e, 


À = à + = ———— [7] 


RC — à 
t=1 


Se — X)E(&;) 
d’où : EG) = E(&) + —— 


D &-x) 


t=1 


Soit E(G,) = a, car E(e,) =0 


De même on démontre que E(&) = &. 
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7 Mrs, CES do = do + E — (& — a)x 
Y=d+ax+E 


E(@o) = ay + E(E) — E(@ — &)X) = & 
car E(& —a)=0 et E(E)=0 
car E(E) est par hypothèse nulle, E œ a) = 0 
t=1 
Les estimateurs sont sans biais. 
* Les estimateurs sont-ils convergents ? 


Puisque les estimateurs sont sans biais, 1l suffit pour qu’ils soient convergents 
que : 


Lim V(&)— 0 lorsque n— 00 où V(a) est la variance de à. 


t=n 2 
| Y er. X)e, | 


1=1 


—— | | Gaprs (7) 
| D &-x) | 


t=1 


2 
V(@G)=E (Z ma) | = E D Ww? €? + 2 vw, W,E, 1 


t<t/ 


v(@) = E{ü mx E@)} D EG — &) = E 


(x — X) 


{=n 


D &-7) 


t=1 


avec W, = 


V@)=N wE(E)+2% ww,E(e,e;) 


Or, d’après les hypothèses : 
— H4 E(e?) = 0° ; 
— HS Eee) = 0 sit £t'. 


2 


V(@) = die = re [8] 


Lorsque ñn — © alors DC — x)” tend également vers œ, d’où V(a;) tend 
t 


vers 0 puisque o? est constant. 
Nous pouvons observer sur l’expression de la variance de 4, que cet estima- 


teur est d’autant plus précis que > — x)” est élevé, c’est-à-dire lorsque : 
t 
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— le nombre d’observations est important ; 
— et/ou les valeurs de la variable explicative sont très dispersées autour de la 
moyenne. 


Une démonstration analogue pour & conduit aux résultats suivant : 


À 1 Fi 
V Go) = où | — + 


a 
n D G-x) 


[9] 


Lim V(&) — 0 lorsque ñn — oo. 
Nous remarquons que : 


2 
V(&) = _ +PVG@)  Cov@à)=-x7V(@) 


Les estimateurs sont convergents. 


onséquences des hypothèses : 
construction des tests 


ypothèse de normalité des erreurs 


Nous allons maintenant introduire de nouveau l’hypothèse qui est celle de la 
normalité des erreurs (cf. exercice 1). Cette hypothèse n’est pas indispensable 
afin d’obtenir des estimateurs convergents mais elle va nous permettre de 
construire des tests statistiques! concernant la validité du modèle estimé. 


Soit &, — N(0, 07) 


Le graphique 3 illustre cette hypothèse sur la distribution des valeurs proje- 
tées sur la droite des moindres carrés. 


À 


Frobsiité 
= 
Il 
Lu 
rs 
Er ju 
FE] 


Xi Xe X3 


Graphique 3 — Les erreurs suivent une loi normale 


1. En effet, cette hypothèse permet de définir la loi de probabilité des estimateurs. 
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onséquences de l'hypothèse de normalité des erreurs 


En préliminaire, cherchons un estimateur de la variance de l’erreur. 
Le résidu est donné par : 
= Yi — Ÿ = Y — dix; — Ào 
Sans rien changer à l’expression précédente, nous pouvons écrire : 
e = ÿ, — x — Ào — x + àiX 
Ou encore : e, = y, — à,X — ào — 4x, + àix 
Or y = àx + à 
D'où : e, = y, — y — &i(x, — x) 
En remplaçant y, et y par leurs expressions [4] et [5], il vient : 
e = (& — &)(x — X) + (6, — €) 


Nous obtenons en élevant ce terme au carré et effectuant la somme sur les n 
observations : 


Dé=@-@) > @-x) +3 6-8) +2@-4) D) G-7E -9 


t 


Or d’après l’expression [6], nous avons : 
JG) 8) = (a à) D (x x) 
que nous nes dans l’expression précédente ä après simplification : 
De=d @-E)-(@-&) > (G-x) 


En prenant l’espérance mathématique de cette dernière expression : 


E] La] = E] DCE a” | - Ef(@-&)]) x -x) 


Examinons les deux membres de cette équation. 


7) OD3e - a” | 5 Xe — 26e, + ë)] = D3 2-2%N a+ Le 
E e? — 2ENE + nE | D» 6? — One? + | 


D 
=E x ee eXa-5Xe| 
+ 


E 


El = [Er -; E(De y] 
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. 2 2 
Nous savons que : Ele’] = 0; 


1 
er Ze -»| = no} — E(e: +e+...+e) 


t 


Or, d’après l’hypothèse d’indépendance des erreurs, les doubles produits 
sont donc tous nuls. Nous obtenons alors : 


1 
nn | ne 2 2 
2] : (& e>| no ut noi — ©, 
*b)Ef(a -&)] D (x —x) = 0? 


2 


En effet E[(a —&)] = a EE —— 
ne D &-x) 
D'où : = 


e x4l = (n — 1)o? — 0? = (n — 2)o? 


L’estimateur de la variance de l’erreur (0?) noté 6? est donc égal à : 


1 
G? = / 10 
Te 2. col 


Ce qui nous permet de définir, en remplaçant la variance des erreurs par son 


estimateur dans les expressions [8] et [9], les estimateurs empiriques! de la 
variance de chacun des coefficients. 


2 


6? — A 
7 D G-x) 
t 


[1] 
1 —2 
ss | he 


n ÿ @-x) 


t 


L'hypothèse de normalité des erreurs implique que : 


& — 4 äf do — 4 
O] O, 


suivent une loi normale centrée réduite N(O, 1). 


. Bien noter les chapeaux qui différencient les estimateurs théoriques (inconnus) des estima- 
tions empiriques (calculables). 
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n 
2 
>_« 2 
t=1 O 
= (1-2) — 
o2 o2 


€ € 


suit une loi du x? (chi-deux) à n —2 degrés de liberté! (somme au carré de n -2 
variables aléatoires indépendantes normales centrées réduites). 


Nous pouvons remarquer que (n — 2) = (n — 2) = 
oO 


suit donc aussi une loi du x? (chi-deux) à n —2 degrés de liberté. 


Il en résulte que : 


&—a Go —& 4, Lo 4 4 
=— et — (l'écart type théorique est remplacé par l’écart type 
Où Où 


empirique) suivent une loi de Student à n —-2 degrés de liberté. 


di — di 


& —4& Où . à 
En effet = est le rapport d’une loi normale 


CA ( D 1 
RATES) 


centrée réduite à la racine carrée d’un chi-deux divisé par son degré de liberté. 


Il est donc possible maintenant de mettre en place des tests statistiques afin 
d’apporter des réponses à des problèmes tels que : 


— comparaison d’un coefficient de régression par rapport à une valeur fixée ; 


— comparaison de deux coefficients de régression provenant de deux échan- 
tillons différents ; 


— détermination d’un intervalle de confiance pour un coefficient. 


est bilatéral, test unilatéral et probabilité critique d'un test 


1) Test bilatéral 


Soit à tester, à un seuil de 5 %, l'hypothèse HO : a, = 0 contre l’hypothèse 
HI : a, #0. 


ä — - à N 2 : £ 
Nous savons que ——— suit une loi de Student à n — 2 degrés de liberté. 


ä] 


1. La notion de degré de liberté correspond au nombre de valeurs restant réellement à disposition 
après une procédure d’estimaton statistique. Si un échantillon comprend 10 observations et 
qu’on dispose en plus de la moyenne de cet échantillon, on ne peut choisir librement les valeurs 
que pour 9 de ces observations, la dixième se déduisant de la valeur de la moyenne. Dans le 
cas présent, le modèle de régression simple, le nombre de degrés de liberté est donc de 
n — 2car nous avons estimé deux paramètres ao et a. 
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0 . : 
suit donc une loi de 


Sous HO (a, = 0) le ratio appelé ratio de Student 

© à] 
Student à n —2 degrés de liberté. Le test d’hypothèses bilatéral consiste donc à com- 
parer le ratio de Student empirique f* — ll à la valeur du r de Student lue dans la 


à 
table à n — 2 degrés de liberté! et pour un seuil de probabilité égal à 5 %, soit si n — 
2 > 30, 1% = 1,96 (la table 2. de Student en fin du livre est tabulée pour les tests 
bilatéraux). Si À > 1%% = 1,96, nous rejetons l'hypothèse HO (cf. graphique 4), le 
coefficient théorique et inconnu a, est significativement différent de 0. 


[0,45 - 
0,4 

0,35 
0,3 

0,25 
0,2 


0,15 


0,05 —25-% 


-3,00 -2,50 -2,00 -1,50 -1,00 -0,50 0,00 0,50 1,00 1,50 2,00 2,50 3,00 
—1,96 1.96 


Graphique 4 — Test bilatéral à 5 % 


2) Test unilatéral 


Soit à tester, à un seuil de 5 %, l’hypothèse HO : a, = 0 contre l’hypothèse 
H1 : a, > 0 ou a, < 0 selon que le coefficient estimé soit positif ou négatif. 


Le test d’hypothèses unilatéral consiste donc à comparer le ratio de Student 


empirique {* = rail à la valeur du f de Student lue dans la table à n — 2 degrés 


= 


Où 
de liberté et done un seuil de probabilité égal à 5 %, soit si n — 2 > 30, 
19% = 1,65.Sir >1%% = 1,65 nous rejetons l'hypothèse HO (cf. graphique 5), 
le coefficient théorique et inconnu a, est significativement différent de 0. 
Attention, la table de Student en fin du livre est tabulée pour les tests bilatéraux, 


il faut donc lire à 10 % =2 x 0,05. 


1. Sile degré de liberté est supérieur à 30, la loi de Student peut être approximée par une loi nor- 
male. 
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0 J—— — - 
= 2,50 2,00 1,50 1,00 0,50 0,00 0,50 1,00 1,50 2,00 2,50 3,00 
+1,65 


TT 


Graphique 5 — Test unilatéral à 5 % (HI : a, > 0) 


Remarque : si nous rejetons l’hypothèse HO pour un test bilatéral, alors nous 
rejetons forcément (pour un même seuil de probabilité) l'hypothèse HO pour un 
test unilatéral. 


3) Probabilité critique d'un test 


La probabilité critique — risque de rejeter à tort l’hypothèse HO — ou encore 
risque de première espèce est donnée par la valeur de la probabilité «° telle que : 


a ; : 
a A es, par la lecture sur une table de Student à n — 2 degrés de liberté. 
Où 


La probabilité critique d’un test unilatéral peut directement se déduire de la 
probabilité critique d’un test bilatéral par une simple division par 2 — 
Œnitaréral = Aitaréra/2 (Opération inverse de celle de la lecture de la table). 

Exemple : Pour 1* = 2,53 et n — 2 = 20, soit à déterminer æ° tel que 
1% = 2,53. Par lecture de la table de Student à 20 degrés de liberté, nous trou- 
vons &@° = 2 % pour un test bilatéral et donc 1 % pour un test unilatéral. 


Exercice n° 3 
LL, fichier C2EX2 


Test de coefficient et intervalle de confiance 


En reprenant les résultats de l’exercice 2, on demande de répondre aux questions 
suivantes. 


1) La propension marginale à consommer est-elle significativement différente de 0 ? 
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2) Quel est l’intervalle de confiance au seuil (ou niveau) de 95 % pour la propension 
marginale à consommer ? 


Solution 


1) La propension marginale à consommer est-elle significativement différente de 0 ? 


Cette question est très importante en économétrie. En effet, dans le cas d’une répon- 
se négative — le coefficient n’est pas significativement différent de 0 — la variable expli- 
cative Revenu ne sera pas considérée comme étant explicative de la consommation 
puisque son coefficient de pondération est nul. 


Il peut paraître étonnant de tester la différence par rapport à zéro et non pas seule- 
ment la positivité ou la négativité du coefficient de régression. En effet, il est commode 
de ne s’interroger que sur la contribution de la variable explicative, qu’elle soit positive 
ou négative. 


Ce problème peut être formulé à l’aide de la théorie des tests à partir des deux hypo- 
thèses suivantes : 


HO : a =0 
H1:a #0 
Si nous rejetons l’hypothèse HO, à un seuil a ! fixé, alors la propension marginale à 


consommer est considérée comme étant significativement différente de 0. Le seuil le 
plus communément employé est œ = 0,05, soit un risque de rejeter à tort HO de 5 %. 


Nous savons que : 

& — di : 1 L ô . L 

—— suit une loi de Student à 7 — 2 degrés de liberté. 

Oâ1 

Sous l’hypothèse HO, cette relation devient : 
&a-0 à 


= — == =1{; — loi de Student à n — 2 degrés de liberté. 
Oa1 Oà1 


ti, est appelé le ratio de Student. 


Nous avons calculé à, lors de l’exercice 2, il convient donc de calculer 6:1 ; or, 
d’après [11], 


22 
Gi — 
= =; 
F D@-5 
t 
(colonne 6 du tableau de calcul 3). L’estimateur de la variance de l’erreur nous est donné 


par [10]: 
> 
A 


n —2 


nous connaissons > (x; — #)? = 64 156 000 
f 


2. 


: , oùe, est le résidu de l’estimation (e; = y; — ÿ;) 


1. Le seuil « est aussi appelé risque de première espèce : c’est la probabilité de rejeter l’hypo- 
thèse HO bien qu’elle soit vraie. 
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a) Calcul de ÿ, etdee, 
La série ajustée Ÿ; est calculée par application des estimations & et & : 
Pr = à + 4 x 
soit ÿ1 = do + 4 Xi —> ea = y —Ÿ 
5 = 1 176,08 + 0,78 x 8 000 = 7.423,95 1 —> e, — 7 389,99 — 7 423,95 = — 33,96 
2 = 1 176,08 + 0,78 x 9 000 = 8 204,93 — e = 8 169,65 — 8 204,93 — —35,28 


Les résultats sont consignés dans le tableau 4. Nous remarquons bien que 
»> e,; = 0 (propriété de la méthode des moindres carrés). 
t 


Tableau 4 -— Calcul du résidu d'estimation 


ñ €r €? 

7 423,95 — 33,96 1 153,38 
8 204,93 — 35,28 1 244,98 
8 595,43 236,28 55 830,26 
8 595,43 57,41 3 296,40 
8 829,72 — 41,64 1 733,93 
9 766,90 — 150,69 22 707,42 
10 547,88 45,57 2 076,39 
11 328,87 — 142,76 20 379,08 
12 890,83 — 132,74 17 620,12 
13 671,81 197,81 39 127,38 

Somme 0,00 165 169,3 
Moyenne 0,00 16 516,93 


b) Calcul de l’estimation de la variance de l’erreur et de l’écart type du coefficient 
de régression. 


L’estimation de la variance de l’erreur est donc égale à : 
22 


2 
>* 
p 165 169,3 
OO, = = 
5 n—2 10 —-2 
ce qui nous permet de calculer la variance estimée de & : 


= 20 646,16 


À 6? 20 646,16 
= —T— - = 0,000 321 8 
JS -x 64156000 
t 


soit 631 = 0,017 9 


c) Calcul du ratio de Student et règle de décision. 


ä nee . : 
= =t; est distribué selon une loi de Student à n —2 


Oâl 


Nous savons que 


degrés de liberté, la distribution d’échantillonnage sous HO est donc représentée par le 
graphe 6. 


1. 


Les petites différences constatées sont dues à des problèmes d’arrondi. 
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Graphique 6 — Distribution d’échantillonnage sous l’hypothèse HO 


La règle de décision pour un seuil & est alors la suivante : 


; su ai ’ 
On calcule le ratio empirique de Student f, — (rapport du coefficient sur son 
oy 


À 


écart type) al 


— Si ti, est inférieur à = : ou supérieur +, é : alors on rejette l’hypothèse HO 
(nous sommes dans la zone hachurée H1), le coefficient a; est alors significativement 
différent de 0 (on accepte a; # 0) ; la variable explicative R, est donc contributive à 
l’explication de la variable C.. 

— Si rx, est compris dans l'intervalle + f, é … alors nous ne sommes pas en mesure de 
rejeter l’hypothèse HO (donc on l’accepte), le coefficient a, n’est pas significativement 
différent de 0 (on accepte ai = 0) ; la variable explicative R,; n’est donc pas explicati- 
ve de la variable C.. 

Il est plus simple de profiter de la symétrie de la loi de Student et donc de calculer 
la valeur absolue du ratio de Student et de la comparer directement à la valeur lue dans 
la table. 

La règle de décision pour un seuil « = 0,05 est alors la suivante : 


a . , : 
— Si À = al > ir — on rejette l’hypothèse HO, le coefficient a; est alors 


a 
significativement différent de 0 (on accepte a, £ 0) ; la variable explicative R, est donc 
contributive à l’explication de la variable C, ; 


. [ail . | 
SH = —— < D — on accepte l’hypothèse HO, le coefficient a, n’est donc 
Oäl 


pas significativement différent de O (on accepte a; = 0); la variable explicative R, 
n’est donc pas contributive à l’explication de C;. 


Nous voyons l’importance que revêt ce test dans l’investigation économétrique ; en 
effet, il permet de tester la pertinence d’une variable explicative qui figure dans un 
modèle et sa contribution à l’explication du phénomène que l’on cherche à modéliser. 


Dans notre exemple, nous calculons le ratio de Student : 
= ll _ 078 
87 Ga 0,0179 
La propension marginale à consommer est donc significativement différente de O, 
la variable Revenu est bien explicative de la variable Consommation. 


= 43,57 > 18% 22,306! — a, £0 


2) Détermination d’un intervalle de confiance, au seuil de 95 %, pour la propension 
marginale à consommer. 


1. Les tables statistiques sont en fin d'ouvrage. Dans le cas d’un test unilatéral, il convient d’uti- 
liser une table correspondant à ce type de test, c’est-à-dire dont seule la partie de gauche est 
hachurée. Dans le cas d’un test bilatéral, ce sont les tables dont les deux parties extrêmes sont 
hachurées. Bien entendu, cela n’est vrai que pour les lois de probabilité symétriques. 
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Nous savons que : 


& — di . : " > : à ï & — di : 
— suit une loi de Student à n — 2 degrés de liberté, soit — = {%_), l'intervalle de 
O1 Oâl 

confiance nous est donné (cf. graphe 4) par : 


_ 

dj — di æ/2 æ/2 
— = +1, D a = a+ x, 
Oäl 


Application numérique pour un seuil & = 0,95 : 
ai = 0,78+2,306 x 0,0179 


Nous avons donc un risque de 5 % que le véritable coefficient a, se trouve à l’extérieur 
de l’intervalle [0,74 ; 0,82] ; nous constatons que 0 ne figure pas dans cet intervalle de confian- 
ce, ce qui est bien entendu cohérent avec la question précédente. 


quation et tableau d'analyse 
de la variance 


quation d'analyse de la variance 
Démontrons les deux relations suivantes : 
— De = 0 : la somme des résidus est nulle (la droite de régression passe 
par le point moyen!). 


n=htärmtes = ie 


> Y — ny — à ve = 2 e, 0 & =y—-4x,en di par n il apparaît que 


Lao. 


— > Y = 25 Y,, il y a égalité entre la moyenne de la série à expliquer et la 
moyenne de la série ajustée. 


Ve — nu orne. 


De ces deux relations nous pouvons en déduire l’équation fondamentale 
d’analyse de la variance : 


do-»» =) 6-5 +9 € 


SCT = SCE +SCR 


[12] 


1. Cela n’est vrai que pour les modèles comportant un terme constant, ou bien, pour les modèles 
sans terme constant, si les données sont centrées sur leur moyenne. 
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La variabilité totale (SCT) est égale à la variabilité expliquée (SCE) + la 
variabilité des résidus (SCR). 


Cette équation va nous permettre de juger de la qualité de l’ajustement d’un 
modèle. En effet, plus la variance expliquée est proche de la variance totale, 
meilleur est l’ajustement du nuage de points par la droite des moindres carrés. 
Il est d’usage de calculer le rapport : 


DG-3) RC 


VO RE 
> G-7) > G-» 


[13] 


R? est appelé le coefficient de détermination, et R le coefficient de corrélation 
multiple (dans le cas particulier du modèle de régression à une seule variable 
explicative, il est égal au coefficient de corrélation linéaire simple entre x et y). 


ableau d'analyse de la variance 


Le tableau 5 présente l’analyse de la variance pour un modèle de régression simple. 


Tableau 5 — Analyse de la variance par une régression simple 


Source Somme Degré Carrés 
de variation des carrés de liberté moyens 
x SCE=N) G-5) 1 SCE/1 
t 
Résidu SCR = De e? n—2 SCR/(n — 2) 
t 
Total SCT = DC — y} n—1 
* 


Les degrés de liberté correspondent au nombre de valeurs que nous pouvons 
choisir arbitrairement (par exemple, pour la variabilité totale, connaissant n — 1 
valeurs, nous pourrons en déduire la n-ième, puisque nous connaissons la 
moyenne y). 


Le test HO : a; = 0 est équivalent au test d’hypothèse! HO : SCE = 0 (la 
variable explicative x, ne contribue pas à l’explication du modèle). 


Soit le test d’hypothèses HO : SCE = 0 contre l’hypothèse HI : SCE Æ 0. 


La statistique? de ce test est donnée par : 


1. Cela n’est vrai que dans le cas du modèle de régression simple. 
2. Nous comparons la somme des carrés expliqués SCE à la somme des carrés des résidus SCR 
qui est représentative de la somme des carrés théoriquement la plus faible. 
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Se 26 


+ _ ddlsce 1 
FER Je [4] 
ddlscr ? 
(a — 2) 


Ou encore : 


re GW 


R? 
: _ ddlsce 1 ”- 1 1 
PUR SCRT Sa “üU-F [1 
ddlscr Ü (n —2) 


(a — 2) 


La statistique F* est le rapport de la somme des carrés expliqués par x, sur la 
somme des carrés des résidus, chacune de ces sommes étant divisée par son 
degré de liberté respectif. Aïnsi, si la variance expliquée est significativement 
supérieure à la variance résiduelle, la variable x, est considérée comme étant une 
variable réellement explicative. 


F* suit une statistique de Fisher à 1 et n — 2 degrés de liberté. Si F* > F?,., 
nous rejetons au seuil « l’hypothèse HO d’égalité des variances, la variable x, est 
significative ; dans le cas contraire, nous acceptons l’hypothèse d’égalité des 
variances, la variable x, n’est pas explicative de la variable y.. 


En effet, UE suit une loi du x? (chi-deux) à un degré de li- 


berté (carré d’une variable aléatoire normale centrée réduite) et 


2 
2° 52 6% 
= = (n — 2) + = (n—2)— suit une loi du x? (chi-deux) à nr — 2 degrés de 
O OS Ci; 


liberté (somme au carré de n — 2 variables aléatoires indépendantes normales 
centrées réduites). 


Ga D (x x) 


2 , 
> 


t 


En effectuant le rapport des deux chi-deux on obtient : F*= 


(n —2) 
8% (x)  SCE 
soit sous HO (a, = 0) F* = Se = . SE suit une loi de Fisher à 1 
€, 
! (n —2) 
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et n —2 degrés de liberté (rapport de chi-deux divisés par leurs degrés de 
liberté). 


En effet, nous avons SCE = > GG — 3) =à >) (x, — x)° car 


Ye —Y = do + dix, — do — diX = d1(x, — X). 
Nous réemarquons : 


ie ”. ad (x x) 
Fe (x) = (2) = 1 — é 
#1 Ga 62/ ne — x) dei =) 


t 


Exercice n° 4 


Équivalence des tests et analyse de la variance 


Un agronome cherche à estimer la relation liant la production de maïs y; au taux de 
bauxite x; se trouvant dans la terre en formalisant la relation : 


Yi = do + di Xi + & 


À partir d’une étude statistique portant sur 85 parcelles de terre, un économètre lui 
fournit les résultats suivants : 


Yi = 132,80 — 1,1x; +e; i = 1,...,85 
(4,3) (10,2) 
(+) = ratio de Student 


De? =6234,32 


1) Montrer que tester l’hypothèse HO : a; = 0 revient à tester l'hypothèse r = 0, où r 
est le coefficient de corrélation linéaire simple entre y; et x; ; le calculer. 


2) Construire le tableau d’analyse de la variance et vérifier les résultats obtenus en 1) à 
partir du test de Fisher. 


3) Le coefficient a; est-il significativement inférieur à —1 ? 


Solution 


1) Les observations ne sont pas datées, le modèle est spécifié en coupe instantanée. 


Pour tester l’hypothèse HO : a; = 0, nous comparons le ratio de Student empirique 
t* = 10,2 à la valeur critique eu = 1,%!. 


1. Le degré de liberté de la loi de Student étant supérieur à 30, il est licite de l’approximer par 
une loi normale, 1,96 est la valeur de la loi normale à un seuil de 0,05 (test bilatéral). 
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Puisque t* est largement supérieur à 1,96, nous rejetons l’hypothèse HO, a; est donc 
significativement différent de 0. Le taux de bauxite est un facteur explicatif (négatif) de 
la production de maïs. 


L'écart type du coefficient à, est égal à : 61 = &/t* = 0,107. 
Montrons l’équivalence de ce test avec HO : r = 0. 


Le coefficient de corrélation linéaire simple est égal à : 


2 
>_& 7) — 7) be — XF) — »| 


l 
r = 


_ 26 sx > Gr 3) | > — x) DE y 


Or, d’après [1], nous savons que : 


DCE & D -H) Gi 7) 


= 2 l É= nn 
SG} SCT 


1 = > F = 


D) 


i 


En effet : 
ä& DC — XF) — 7) = à x & > —x) =& > G — x) 
=D Gx-à7 =) G-&-5+@) =) @-5)=8SCE 


Pour le modèle de régression simple, nous avons égalité entre le coefficient de déter- 
mination et le carré du coefficient de corrélation. 


Nous avons la relation : 


F* R? : r? _ «y 
 A-R)/n-2)  (-r)/(n-2) 


donc on en déduit : 


,__TV(G—2) 


= ——— qui suit une loi de Student à n — 2 degrés de liberté. 


Va") 


Ceci permet de tester si la relation entre y; et x; est significative, ou encore si le 
coefficient r est significativement différent de 0. Le calcul du coefficient de corrélation 
ne pose alors plus de problème : 


= 10,2 = 2 + 7? = 0,556 — |r| = 0,745! 


Nous savons que le coefficient r est en réalité négatif puisque le coefficient de régression & 
est lui-même négatif. 
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2) Pour construire le tableau d’analyse de la variance, il nous faut connaître : 


SCE = > G — 5) 
SCR=Ÿ € 
SCT = >G: - 5) 


2 
2 SCR 


Doi-m SCT 


Or, d’après [13], nous avons : R? = 1 


R? = r°? = 0,556, la connaissance de SCR = >. e — 6 234,32 permet de déterminer 


SCT = 14041,26 ainsi que, d’après [12], SCE = 7 806,94. Nous pouvons mainte- 
nant construire le tableau 6 d’analyse de la variance. 


Tableau 6 — Analyse de la variance 


Source Somme Degré Carrés 
de variation des carrés de liberté moyens 
Xi SCE = 7 806,94 1 7 806,94 
Résidu SCR = 6234,32 85 -2 75,11 
Total SCT = 14041,26 85-1 
SCE/1 7 806,94 
F* ls = 103,94 > FV$ = 3,96 


— SCR/n-2) 75,11 


Nous remarquons que F* = (t*}?. 


Dans le modèle de régression simple, il y a équivalence à tester : 


HO H1 
a; =0 a £0 
Fx,y = 0 rx,5 Z 0 
SCE =0 SCEZÆO0 


Le premier test porte sur la pente de la droite de régression, le deuxième test sur le 
coefficient de corrélation entre x et y et, enfin, le troisième a pour but de juger si la 
somme des carrés expliqués est significative, ces trois tests néanmoins répondent à la 


même interrogation. 
3) Le coefficient a, est-il significativement inférieur à — 1 ? 
La formulation des hypothèses est la suivante : 
HO : a; = -1 
HI : a; < -1 
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Sous l’hypothèse HO, nous avons : 


Gal _@-CD _1-L1+1 
Gal : CA 7 0,1078 


= 0,92 < 109 = 1,65! 


Nous acceptons l’hypothèse HO, a; n’est pas significativement différent de — 1. 
Nous pouvons aussi répondre à cette question en vérifiant que la valeur — 1 est compri- 
se dans l'intervalle de confiance : 


di = à +1,96 6; > dj [ 1,31; 0,89] 


(Attention : 1%% = 1,96 car le test est maintenant bilatéral.) 


a prévision dans le modèle 
de régression simple 


Lorsque les coefficients du modèle ont été estimés, il est possible de cal- 
culer une prévision à un horizon k. 

Soit le modèle estimé sur la période fr = 1,...,n: y =@+ax+e,, 
si la valeur de la variable explicative x, est connue en n + 1(x,:1), la pré- 
vision est donnée par : Ÿ,41 = Go + @ Xurre 

Montrons que cette prévision est sans biais. 

L’erreur de prévision est égale à : e,41 = Yyui — Yu 
que l’on peut écrire : e,11 = (Go + &i Xur1 + Eux) — (Go + &i Xyu1) 
soit : eys1 = (Go — do) + (@i — i)xys1 + En. En se référant aux hypothèses 
du modèle, on a : 

E(e,…) = 0 


Une démonstration analogue permet d’obtenir E(e,,;,) = 0. 


La prévision sans biais est donc obtenue par l’application directe du 
modèle de régression estimé. Cependant, dans la pratique, il n’est que de 
peu d’utilité de connaître la prévision si nous ne savons pas quel degré de 
confiance nous pouvons lui accorder. Nous allons donc calculer la varian- 
ce de l’erreur de prévision qui nous permet de déterminer un intervalle de 


1. 


Valeur de la loi normale au seuil de 5 % ; en effet il s’agit d’un test unilatéral. 
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confiance! bornant la prévision. La variance de l’erreur de prévision est donnée 
par : 


Ve) = V(@o — 0) + (@i — &i)Xuxi + Enx1) 
Puisque la variable x, ,, est certaine et l’erreur £,., est non autocorrélée avec les 
£, cette expression peut s’écrire : 


AGME V@o) + x°,, V (Gi) + 2x, COV(Go,&1) + V(Es41) 


n+1 


En remplaçant les variances et la covariance des coefficients par leurs expres- 
sions d’après [9] et connaissant V(£,:1) = o?, nous obtenons : 


og? _ 
V(es41) = (= + V(@) + x2,, V(@) — 2x,4X V (@) + o:) 


Ou EnCOTrE : 


(C7 2e x) 


= 20 | 
V(es+1) VO Len) ©, ñ + De L x) + 1 [16] 
Lt 

Nous pouvons observer que, dans cette formule, la variance de l’erreur de 
prévision est fonction de l’écart quadratique entre la variable exogène prévue et 
la moyenne de cette même variable : plus la valeur prévue s’éloigne de cette 
moyenne, plus le risque d’erreur est important. De même, nous remarquons que 
la variance de l’erreur de prévision est une fonction inverse de la variabilité de 

la série explicative. 


L'hypothèse de normalité de &, permet alors de déterminer un intervalle à 
(1— a) % pour la prévision : 


+ Ci Eu 14 


Een 


eg 2 
Ent = Ya — Ya > N 0, © — 


do + diXnt1 — Yn+1 


Soit — 1, (Student à n —2 d.d.l.) 


= + Gt En 1) 


Re 


Vnt1 — Vn+1 TA Oe Dre: _ D + +1 [17] 
Xs — X 


1. Ilest plus juste de parler d'intervalle de prédiction. 
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Cas particulier 


Lorsque nous utilisons le modèle de régression simple pour calculer une droite 
de tendance (moindres carrés sur le temps), le modèle est spécifié ainsi : 


T=@w+ät+e, pour f—=1,...,n 


Pour calculer la prévision à l’horizon #, nous employons la formule d’extra- 
polation : 


_ 


Tin = & + &(n + h), et l'intervalle de prédiction se trouve alors sur deux bran- 
ches d’hyperbole! (n + h — Fÿ illustré par le graphique 7. 


Série brute 


\ 
Tendance 


60 — 
É Le pa 


A EE EE 
2346567 89 101 1246141816 1718 19 20624 23 25 2435 


Graphique 7 — Intervalle de la prévision par extrapolation de tendance 


Exercice n° 5 
LL, fichier C2EX2 


Prévision dans un modèle de régression simple 
Nous reprenons le modèle consommation-revenu estimé lors de l’exercice 2 : 
» = 1176,08 +0,78 x, +e, 
(0,21) (43,53) 
10 
t de Student 


n 
(+) 


1) Calculer le coefficient de détermination et effectuer le test de Fisher permettant de 
déterminer si la régression est globalement significative. 


1. C’est l’effet « trompette », le lecteur devinera pourquoi... 
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2) Quelle est la conséquence sur la consommation de l’augmentation du revenu de 8 % ? 


3) Pour les années 11 et 12, on prévoit respectivement 16 800 et 17 000 dollars de reve- 
nu par habitant. Déterminer la prévision de consommation pour ces deux années 
ainsi que l'intervalle de prédiction au seuil de 95 %. 


Solution 

1) Pour calculer le coefficient de détermination, nous nous référons à la relation [15] : 
R°? r? 

TA-R)@-2 (-r)/R-2) 


Soit : r? — 0,99, nous pouvons alors calculer le Fisher empirique : 


* 


= (1)? = 43,5? 


F* = 1895,3 > PRE = 5,32, la variable explicative est significative. 
2) Augmentation de 8 % du revenu. 
Nous avons : 
Aÿ = & Ax, soit Aÿ, = 0,78 x Ax, = 0,78 x 0,08 = 0,062 4 
La consommation augmente de 6,24 %, soit un peu moins que le revenu. 


3) Les prévisions sont calculées par l’utilisation du modèle estimé. 
Fu = 1 176,08 + 0,78 x11 = 1 176,08 + 0,78 x 16 800 
= 14 280,08 


L’intervalle de prévision [17] peut alors être calculé : 


Le (ui — x)? 


y — = Ÿ + 17 CA LA +1 
11 11 : DITES DT 


avec : n =10 


G: — 143,69 (d’après l’exercice 3) 
> — x)? = 64156 000 (d’après l’exercice 3) 
1 — 11280 (d’après l’exercice 2) 
115 = 2,306 
Xi —= 16 800 
Yu = 14280,08 + 2,306 x 180,32 
IC =1[13 864,24; 14695,91] 
La réalisation a 95 % de chance de se trouver à l’intérieur de cet intervalle! 


De même, pour l’année 12, nous obtenons : 


2 = 1 176,08 + 0,78 x12 = 1 176,08 + 0,78 x 17 000 
= 14436,08 


y = 14436,08 + 2,306 x 182,32 
IC  —=114015,65; 14856,51] 


1. La distribution étant normale (loi continue), il est clair que la probabilité d’apparition de cha- 
cune des valeurs de l’intervalle n’est pas identique. La valeur la plus probable se trouve au 
centre de l’intervalle. 
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Exercice n° 6 


Comparaison de coefficients de régression 


Un économiste spécialisé en économie du travail s’intéresse à la relation liant la 
rémunération et la durée des études (théorie du capital humain). Pour ce faire, il dispo- 
se d’un échantillon de 40 hommes et 25 femmes ayant le même âge, dont il relève la 
rémunération annuelle (y;), exprimée en milliers d’euros, et le nombre d’années 
d’études (x;). 


Les estimations économétriques conduisent aux résultats suivants : 
Pour les hommes : 


Yi = 18,60 + 1,8x; +e; i = 1,...,40 n1 = 40 


(9,3) (5,2) 
() = ratio de Student 
R? = 0,42 


Pour les femmes : 


y = 14,50+0,7x+e i=1,...,25 n —25 


(12,8) (2,5) 
() = ratio de Student 
R? = 0,22 


1) L'influence de la durée des études sur la rémunération vous semble-t-elle signifi- 
cative ? 


2) Existe-t-il une différence significative de l’impact de la durée des études sur la rému- 
nération des hommes et des femmes ? 


Solution 


1) Pour répondre à cette première question, nous pouvons analyser soit les ratios de 
Student, soit le coefficient de détermination. 


Le ratio de Student empirique de la variable « années d’études » est égal à : 


Pour les hommes : 


= 


ah 
Bees 106 
Oäh 


Pour les femmes : 


= 


a 
= 2 = 2,5 > 190 = 2,06 
OGf 


Les écarts types sont : 
CA = 0,34 et Gaf = 0,28 


Les deux coefficients de régression sont donc significativement différents de O. Il est 
à noter que, pour les femmes, le coefficient de pondération des années d’études est plus 
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faible et moins significatif que celui des hommes. Les probabilités critiques! sont, pour 
les hommes, de æ&° = 0,000 1 et de &° — 0,02 pour les femmes (nous considérons le 
coefficient comme non significativement différent de 0 au seuil de 2 %). 


Le test de Fisher mené sur les coefficients de détermination conduit aux mêmes 
résultats. 


2) Ce problème se ramène à un test de différence de moyennes de variables aléatoires 
normales indépendantes et de variances inégales. 


H0:a; =as H0:d=a —-ar =0 
Hl:a £as Hl:d=a,-a; £0 
(@ — àÿ) — (ar — a) 


Oän—àf 


Le rapport suit une loi de Student à n1 + n2 — 4 degrés de 


liberté. 


Avec 65 = 6%, +03, et = ä, et sous l’hypothèse HO, le rapport s’écrit : 


= = 2,49 > 


u L, 
à V0,34 +0,28 sl 


Rappel : Var(a X x1 + b X x2) = a?Var(x1) + b?Var(x>) + 2abCov(x:,x) où x1 et x 
sont deux variables aléatoires et a et b sont deux scalaires. Ici Cov(â;,à;) = 0 car les 


d 1,8 — 0,7 
( ) DS = 1,96 
oi 


deux régressions sont indépendantes. D’où Var(@; — 4,) = Var(à;) + Var(ä,). 

Nous rejetons l’hypothèse HO, il existe une différence significative des coefficients 
de régression : la durée des études des femmes a moins d’impact sur la rémunération 
que la durée des études des hommes (sur cet échantillon...) 

Nous pouvons déterminer la probabilité critique de ce test (probabilité à partir de 
laquelle nous sommes amenés à accepter l’hypothèse HO). La lecture de la table de 
Student à 61 degrés de liberté (sur la table wo) indique une probabilité comprise entre 
0,01 et 0,02 (la valeur exacte déterminée par la fonction Excel « loi.student » 
est 0,0154). Le risque de se tromper en rejetant l’hypothèse HO est donc de 1,54 % ; 
compte tenu de ce très faible risque, nous rejetons l’hypothèse HO. Evidemment, plus la 
probabilité critique est faible plus nous sommes confortés dans notre décision. 


Exercice n° 7 


Apprendre à manipuler les formules 
Soit les résultats d’une estimation économétrique : 
Y = 1,251 x, — 32,95 +e, 


n = 20 
R? = 0,23 
6. = 10,66 


1. Cette notion est importante : il s’agit de déterminer le seuil de probabilité à partir duquel on 
accepte l’hypothèse HO. Plus ce seuil est faible, moins le risque de se tromper est important. 
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1) A partir des informations connues, on demande de retrouver les statistiques sui- 
vantes : la somme des carrés des résidus (SCR), la somme des carrés totaux (SCT), 
la somme des carrés expliqués (SCE), la valeur de la statistique du Fisher empirique 
(F*) et l’écart type du coefficient 41(6a1). 


2) Le coefficient de la variable x est-il significativement supérieur à 1 ? 


Solution 


SCR 
1) On sait que 6, = ri 10,66 = SCR = (10,66)? x 18 = 2045,44 


Nous pouvons calculer SCE et SCT à l’aide du coefficient de détermination. 


R? = 0,23 = 1 — SCR/SCT 
= SCT = SCR/(1 — R?) = 2045,44/(1 — 0,23) = 2656,42 


Or SCT = SCE + SCR = SCE = 610,98 
Nous pouvons calculer maintenant : 
R? SCE 


F* = TG =D = SCRG-D 5,40 = 1* = V/F* = 2,32 


(dans le cas d’un modèle de régression simple 1"? = F*). Nous pouvons en déduire 


: À à 1,251 

l’écart type d fficient : 31 = — = = 0,54. 

écart type du coefficient : Ga = = 3.32 

2) On pose le test d’hypothèses : 
HO : a; = 1 contre l’hypothèse H1 : a; > 1 
Sous HO, nous pouvons écrire : 
di — a; 1,25 — 1 0.05 1 

EE = — = = 0,46 < tj —1,734 = nous sommes donc dans la 
#1 Dal 0,54 
zone de l’acceptation de HO, le coefficient a; n’est pas significativement supérieur 
à 1. 


Exercice n° 8 


Apprendre à utiliser les formules 


À partir d’un échantillon de 190 observations, on étudie la relation entre la variable 
à expliquer y; et la variable explicative x;. 


À l’aide des informations fournies ci-dessous reconstituez les huit valeurs man- 
quantes signalées par VM1, ..VMB. 


1. Attention, comme le test est unilatéral et que la table de Student de cet ouvrage est tabulée direc- 
tement pour «/2 (cas le plus général d’un test bilatéral), il convient donc ici de lire sur la table à 
un seuil de 0,10 = 2 x 0,05. 
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Dependent Variable: Y 
Method: Least Squares 
Sample: 1 190 

Included observations: 190 


Variable Coefficient Std. Error  t-Statistic 
C —4364.928 VMI —16.61141 
X VM4 VM3 VM2 
R-squared VMS Mean dependent var 
S.E. of regression 322.8850 S.D. dependent var 
Sum squared resid VM7 F-statistic 


Prob. 


0.0000 
0.0000 
VM6 
VM8 
778.9623 


On donne ©, = 3,447 et x — 38,416 


Solution 


A 


â 
VMI : directement par 63, = he 262,76 


+ 
äo 


VM2':t5 = VF*= VTT8,96 = 27,91 


A 


VM3 : CA = TES Of CA = 322,88 à 
Xi —X 
D &-x) 
= d'oùt EU: — 7 = (n — 1) x 6? = 189 x (3,447)? = 2245,66 
n — 
F Ge 322,88 
Oä: 


6,81 


d’où VM4 = VM3 x VM2 = 190,15 


R?/1 
VMS : on sait que F* = / 


EG V265,6. 


R? 


— (= R)/n—2) (1—R2)/188 


778,96 


= 778,96 — R°? 


2 
VMT : SCR = e?, or 6? = es 


778,96 + 188 
VM6 : ÿ = ào + à x x = —4364,928 + 190,15 x 38,416 — 2939,8 


= 0,80 


d'où Ye? = (n — 2) x 62 = 188 x (322,88)? — 19 599 280. 


SCE SCR 
VMB : R?— = ] > SCT = 
SCT SCT 


i— 3) SCT 
me, ŒUER = 723,7 
n—l n—l 


1. 
donc nous divisons par n — 1. 
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SCR 


1—R 


; = 98 986 262 


Nous prenons ici la formule de l’estimateur de l’écart type calculé à partir d’un échantillon, 


e modèle 
de régression multiple 


e modèle linéaire général est une extension du modèle de régres- 
sion simple abordé au chapitre précédent. Après avoir présenté le 
modèle linéaire général (1), nous envisageons une procédure d'es- 
timation des paramètres en étudiant les propriétés statistiques des esti- 
mateurs (Il). Les différents tests d'hypothèses concernant les coefficients 
du modèle sont proposés en (ll), et la section (IV) est consacrée à l'analy- 
se de la variance ainsi qu'aux tests s'y rattachant. 
En (V) nous présentons une classe particulière de séries explicatives : les 
variables indicatrices, puis la prévision à l'aide du modèle linéaire géné- 
ral fait l'objet de la section (VI). 
Enfin nous terminons ce chapitre par quelques exercices récapitulatifs. 


e modèle linéaire général 


résentation 


Lors du chapitre précédent, nous avons considéré qu’une variable endogène est 
expliquée à l’aide d’une seule variable exogène. Cependant, il est extrêmement 
rare qu’un phénomène économique ou social puisse être appréhendé par une 
seule variable. Le modèle linéaire général est une généralisation du modèle de 
régression simple dans lequel figurent plusieurs variables explicatives : 


Ye = 0 + Ai Xi + GX +... + &Xx +E, pour ft = 1,...,n 
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7. = variable à expliquer à la date r ; 
x, = Variable explicative 1 à la date f ; 
X, = Variable explicative 2 à la date f ; 


x —= Variable explicative k à la date r ; 


Go: d,-..,& — paramètres du modèle ; 

8, — erreur de spécification (différence entre le modèle vrai et le modèle spé- 
cifié), cette erreur est inconnue et restera inconnue ; 

n — nombre d’observations. 


orme matricielle 


L'écriture précédente du modèle est d’un maniement peu pratique. Afin d’en 
alléger l’écriture et de faciliter l'expression de certains résultats, on a habituel- 
lement recours aux notations matricielles. En écrivant le modèle, observation 
par observation, nous obtenons : 


Yi = do + di Xi +dXn +... + dx Xu + € 
Y = do + di Xp + @ Xp +... + Ax Xxo + E2 


Yi = do + Xi + Xy +... + A Xx + & 


Yn = d) + Ai Xin + A Xon + eee + A Xp + En 


Soit, sous forme matricielle : Y = X a + € 
(a,1) (a,k+1) &+1,1) (n,1) 
avec : 
Yi Xi ZX Xk1 Ei 
Y2 Xi2  X2 Xx2 do E2 
‘ di 
Y = : X = 5 A — [42] A — 
Y: 1 Xi: X25 Xxr . €: 
dk 
Yn il Xin Xn .….. Xxn En 


Nous remarquons la première colonne de la matrice X, composée de 1, qui 
correspond au coefficient a, (coefficient du terme constant). 


La dimension de la matrice X est donc de n lignes et k + 1 colonnes (k étant 
le nombre de variables explicatives réelles, c’est-à-dire constante exclue). 
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L'écriture sous forme matricielle rend plus aisée la manipulation du modèle 
linéaire général, c’est pourquoi nous l’adoptons par la suite. 


stimation et propriétés 
des estimateurs 


stimation des coefficients de régression 


Soit le modèle sous forme matricielle à k variables explicatives et n observa- 
tions : 


Y =Xa+e [1] 
Afin d’estimer le vecteur a composé des coefficients a, ai ...a,, nous appli- 


quons la méthode des Moindres Carrés Ordinaires (MCO) qui consiste à mini- 
miser la somme des carrés des erreurs, soit : 


Min Ÿ e=Mine’e = Min (Y — Xa) (Y — Xa) = MinS [2] 
t=1 
avec &’ transposé! du vecteur &. 


Pour minimiser cette fonction par rapport à a, nous différencions? S par 
rapport à a : 


08 


0a 

Cette solution est réalisable? si la matrice carrée X’X de dimension 

(&+1,k+1) est inversible. La matrice X’X est la matrice des produits croisés 

des variables explicatives ; en cas de colinéarité parfaite entre deux variables 
explicatives, la matrice X’X est singulière et la méthode des MCO défaillante. 


=-2XY+2XXa-0—| G—=(X X)'X'Y [3] 


On appelle équations normales les équations issues de la relation : 
X'Xa=Xx'Y 


1. Nous désignerons par le signe ” les transposés de vecteur ou de matrice. 
2. S=(Y-Xa)(Y —Xa)=Y'Y —Y'Xa—a'X'Y +a/X/Xa 
= Y'Y -2a'X'Y +a'X'Xa. 
3. Les conditions de second ordre sont vérifiées du fait que X’X est une matrice définie semi- 
positive. 
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Soit, sous forme matricielle : 


n ) X1r ) X5 sexe ) Xxr ss DE 
t 
2 
> Xi: ) Xi, > Xi: X2r ... > Xi: Xkr = Xi Ÿ 
) le Jr 
2 = 
X2; X2 X1r X; c.. X2 Xkr à. — 
Le Le L 2 k >* 
21 Y: 


?: dk ) Xi Y 
) Xkr > Xkr Xir > Xxr Xos ES > X}; 
Le modèle estimé s’écrit : 
Vs — do + dix + dXn +... + d Xu + € 


avec e, = y, — ÿ, où e, est le résidu, c’est-à-dire l’écart entre la valeur observée 
de la variable à expliquer et sa valeur estimée (ajustée). 


Attention : il convient de bien distinguer entre l’erreur de spécification du 
modèle (noté &,) qui est et restera inconnue et le résidu (e,) qui, lui, est connu. 
1) Cas particulier 


Si nous raisonnons sur des données centrées, l’estimateur de a peut s’écrire en 
fonction des matrices des variances et covariances empiriques : 


ä Var(x:) Cov(xi, x) Covixi, xs) ... Cov(xi x) \ 

d Cov(x, X1) Var(x) Cov(x, X3) ss Cov(x, Xk) 

G | — | Cov(xs, x) Cov(x:, x)  Var(x:) ….  Cov(xs, xx) 

en Cov(xu, x) Coviu, x) Covix, x3) ... Var(x) 
Cov (x:,y) 
Cov(x, y) 

U Cov(x:, y) 
Cov(x, y) 
avec % =y-à X: — D X To. — Xe: 


Que sont des données centrées sur la moyenne ? Soit x; une variable connue 
sur n observations et x sa moyenne, nous pouvons calculer une nouvelle variable 


(X, = x,-x) dont la somme est par construction nulle : 3e — x) = + = 0. 
t=1 t=1 
Nous avons donc X = 0. 


2) Effet de la variation d'une seule des variables explicatives 


Soit le modèle estimé : y, = & + & x + @ Xn +... + Xu + e. 


50 e ÉCONOMÉTRIE 


Si la variable x; passe de la valeur x, à (x, + Ax;,), toutes choses étant 
égales par ailleurs (les k — 1 autres variables restant constantes), alors la 
variable à expliquer varie de &, Ax; : Aÿ, = & Axy. 


Les coefficients s’interprètent donc directement en terme de propension mar- 


ginale. 


ypothèses et propriétés des estimateurs 


Par construction, le modèle est linéaire en X (ou sur ces coefficients) et nous dis- 
tinguons les hypothèses stochastiques (liées à l’erreur £&) des hypothèses struc- 


turelles. 


1) Hypothèses stochastiques 


— Hi 
— H2 : 
— H3 : 
— HA : 


— HS 


: les valeurs x;, sont observées sans erreur. 


E(&,) = 0, l’espérance mathématique de l’erreur est nulle. 
E(e?) = 6}, la variance de l’erreur est constante (Wr) (homoscédasticité). 


E(e, 8) = 0 sit tr’, les erreurs sont non corrélées (ou encore indé- 
pendantes). 


: Cov(x;,, &,) = 0, l’erreur est indépendante des variables explicatives. 


2) Hypothèses structurelles 


— H6 : 


— H7 : 
— H8 : 


absence de colinéarité entre les variables explicatives, cela implique 
que la matrice (X’ X) est régulière et que la matrice inverse (X’ X)”! 
existe. 


(X' X}/n tend vers une matrice finie non singulière. 


1 


n >k+1, le nombre d’observations est supérieur au nombre des 


séries explicatives. 


3) Propriétés des estimateurs 


Considérons les propriétés de l’estimateur [3]. 


Le modèle sous forme matricielle peut s’écrire, comme pour le modèle de 
régression simple, de différentes manières : 


1. Dans le cas d’une égalité, nous aurions un système de n équations à n inconnues, donc parfai- 
tement déterminé. 
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Y=Xa+e \ 
IT EE (e = résidu) 
Y=Xxa 


Nous obtenons : 


G=(X X)1X'Y = (XX) X{(Xa+e) 
â=(X X) 1 X'(Xa)+(X' X)7! X'e [4] 
â=a+(X X)1X'e 
d'où EG)=a+(X X) 'X'E(s)=a car E(s) =0 
L’estimateur est donc sans biais : E(G) = a 


Calculons maintenant la matrice des variances et covariances des coefficients 
de régression Q;. 


Q; = E{@ — a)@ — a} 


Or, d’après [4], (@— a) = (X'X) ! X'e et (a — a) =e'X(X' X) ! puisque 
(X' X)7! est symétrique!. 


@—a)@— a) =(X' X) 1 X'6e’ X(X' X)7! d’où 


Q; = (X'X) 'X'E(ee')X(X' X) ! avec Eee) =, =0o?1— matrice des 
variances et covariances de l’erreur €. 


En effet, d’après les hypothèses H3 et H4 nous avons : 


Eee) E(eie) 


E(e:&,) 
Q, = E(ee') = E(£&:€;) ÆE(£8€) E(£ &,) 
E(e, 81) E(E, €) E(E, €») 
2 0 0 
< o 0 
0 0 0 o? 


Soit: Q;=0(X X) 'X'X(X'X)! 


Q, = 02(X'X) ! [5] 


1. Nous rappelons quelques règles du calcul matriciel : (ABC) = C’B'A' et si À est symétrique 
A! = À et donc [(X’ X)-!J = (X’ X)-!. 
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2 / —1 

Q; = “ (=) —> Lim, = 0 sin —> o (d’après les hypothèses H3 
et H7). L’estimateur est donc convergent. 

Théorème de Gauss-Markov : L’estimateur [3] des moindres carrés est qua- 
lifié de BLUE (Best Linear Unbiaised Estimator), car il s’agit du meilleur esti- 
mateur linéaire sans biais (au sens qu’il fournit les variances les plus faibles pour 
les estimateurs). 

Il est à noter que l’estimateur du maximum de vraisemblance des paramètres 
fournit des résultats identiques à ceux de l’estimateur des MCO si l’hypothèse 
de normalité des erreurs est vérifiée. 


Après un calcul matriciel!, il apparaît que nous pouvons estimer sans biais 
o? par : 


! 


e!e 
—— 6 
: n—k—1 [61 


En remplaçant la variance de l’erreur par son estimateur, nous obtenons : 


Q; = 62(X'X)°! [7] 


4) Le théorème de Frisch, Waugh et Lovell (FWL) 


Supposons que les variables explicatives soient séparées en deux groupes repré- 
sentés par les matrices X, et X,. Le modèle s’écrit : Y = X;,a; + X,a, +e. 

Le théorème de FWL nous dit que l’estimateur des MCO du paramètre a, et 
des résidus sont les mêmes que ceux du modèle : M,Y = M;X,a; +v avec 
ML = ROC X) CN, 

La matrice M, est symétrique et idempotente (MM, = M), de plus 
MX; = 0. 

Ce théorème permet de bien comprendre le problème de la spécification d’un 
modèle : si une variable Y est effectivement expliquée par le groupe de variables 
X, et X>, il faut impérativement faire figurer dans le modèle ces deux groupes 
de variables même si seul le groupe de variables X, nous intéresse. 


1. Voir démonstration en annexe C. 
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quation d'analyse de la variance 
et qualité d'un ajustement 


Comme pour le modèle de régression simple, nous avons : 


DNy=d 5-7 
be =0 


De ces deux relations, nous en déduisons l’équation fondamentale d’analyse 
de la variance : 


do-» =) 6-5 +3 e 


SCT = SCE + SCR 


[8] 


La variabilité totale (SCT) est égale à la variabilité expliquée (SCE) + la 
variabilité des résidus (SCR). 


Cette équation va nous permettre de juger de la qualité de l’ajustement d’un 
modèle ; en effet, plus la variance expliquée est « proche » de la variance tota- 
le, meilleur est l’ajustement global du modèle. C’est pourquoi nous calculons le 
rapport SCE sur SCT : 


DG->) ne 


R = =— = - ——— [9] 
D G-5) D G-5) 


R? est appelé le coefficient de détermination, et R le coefficient de corréla- 
tion multiple. R? mesure la proportion de la variance de Y expliquée par la 
régression de Y sur X. 


Dans le cas de données centrées (moyenne nulle) et seulement dans ce cas, 
le coefficient de détermination est égal à : 


[10] 


Cette qualité de l’ajustement et l’appréciation que l’on a du R? doivent être 
tempérées par le degré de liberté de l’estimation. En effet, lorsque le degré de 
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liberté est faible!, il convient de corriger le R? afin de tenir compte du relative- 
ment faible nombre d’observations comparé au nombre de facteurs explicatifs 
par le calcul d’un R? « corrigé » noté R 


2 n—1 
R =1—- (1 -R? 11 
UF) [11] 


OnaR <R°etsin est grand À = R2. 


Nous verrons au chapitre 4 section IV deux critères (Akaïke et Schwarz) per- 
mettant d’arbitrer, lors de l’introduction d’une ou plusieurs variables explica- 
tives, entre la perte de degrés de liberté et l’apport d’information. 


Exercice n° 1 


LL fichier C3EX1 


Mise sous forme matricielle d’un modèle et calcul des coefficients 
de régression 


Soit le modèle à trois variables explicatives : 


Ye = do + Ai Xi + Q2 Xa + 43 Xy + Er 


Nous disposons des données du tableau 1. 


1) Mettre le modèle sous forme matricielle en spécifiant bien les dimensions de cha- 
cune des matrices. 


2) Estimer les paramètres du modèle. 


3) Calculer l’estimation de la variance de l’erreur ainsi que les écarts types de chacun 
des coefficients. 


4) Calculer le R? et le ra corrigé. 


1. Dans le cas d’un modèle où le nombre d’observations est égal au nombre de variables explica- 
tives (degré de liberté = 0), le R? = 1. Cependant, le pouvoir explicatif de ce modèle est nul. 
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Tableau 1 — Valeurs observées de y, x1,x2 et x; 


t y X] X2 X3 
1 12 2, 45 121 
2 14 1 43 132 
3 10 3 43 154 
4 16 6 47 145 
5 14 7 42 129 
6 19 8 41 156 
7 21 8 32 132 
8 19 5 33 147 
9 21 5 41 128 
10 16 8 38 163 
11 19 4 32 161 
12 21 9 31 172 
13 25 12 35 174 
14 21 7 29 180 


Solution 


1) Forme matricielle 


Nous disposons de 14 observations et trois variables explicatives, le modèle peut 
donc s’écrire : 
Y=Xa+e avec: 


12 1 2 45 121 & 
14 1 1 43 132 40 | 
pe lle A Se es 
< . . . : (12) €r 
: Ain à : da 
21 1 7 29 180 
€14 
Dimensions : 
(14,1) (14,4) (4,1) (14,1) 
2) Estimation des paramètres 
Nous savons d’après [3] que 4 = (X’ X)-! X' y. 
Calcul de X’ X et de (X’ X)-! 
X' X 
1 2 45 121 
UMTS L 1 1 43 132 
D L 1 3 43 154 | _ 
45 43 43 29 0 ! 
121 132 154 180 OURS | 
1 7 29 180 
14 85 532 2 094 


85 631 3126 13132 
532 3126 20666 78683 
2094 13132 78683 317950 
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20,16864 0,015065 —0,23145  —0,07617 
0,015065 0,013204 0,001194  —0,00094 


(KT = 
—0,23145 0,001194 0,003635 0,000575 
—0,07617  —0,00094 0,000575 0,000401 
Calcul de X’ Y 
X' Y 
12 
1 1 1 1 14 248 
2 1 3 7 10 | — 1 622 
45 43 43 ... 29 à EH 9202 
121 132 154 ... 180 ° 37 592 
21 
Calcul de & 
(XX)! X'Y 
20,16864 0,015065 —0,23145  —0,07617 248 
0,015065 0,013204 0,001194  —0,00094 1 622 


—0,23145 0,001194 0,003635 0,000575 9 202 
—0,07617  —0,00094 0,000575 0,000401 37 592 


32,89132 
0,801900 

— 0,38136 

— 0,03713 


Soit & — 32,89 ; & — 0,80 ; 4 — —0,38 ; à — —0,03 


Les calculs que nous venons de développer sont longs et fastidieux et mettent en évi- 
dence l'intérêt incontestable d’utiliser un ordinateur. 


3) Calcul de 6? et de 6? 


D’après [6] 6? — 


Die nous devons donc calculer le résidu e. 
n—k-1 
Soit e — y, — (Go + &iX1 + xx + GX) 

€ = ÿ; — 32,89 — 0,80 x1, + 0,38 x2, + 0,03 x3, 


Par exemple pour e; : 

ei = ÿ1 — 32,89 — 0,80 x11 + 0,38 x21 + 0,03 x31 

ei; = 12 — 32,89 — 0,80 x 2 + 0,38 x 45 + 0,03 x 121 = —0,84 
Le tableau 2 présente l’ensemble des résultats. 


Par construction, la somme des résidus est bien nulle. 
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Tableau 2 - Calcul du résidu 


u Ye 5 e; e? 
1 12 12,84 — 0,84 0,71 
2 14 12,39 1,61 2,58 
3 10 13,18 — 3,18 10,11 
4 16 13,39 1,61 2,58 
5 14 17,70 — 3,70 13,67 
6 19 17,88 1,12 1,26 
7 21 22,20 — 1,20 1,44 
8 19 18,86 0,14 0,02 
9 21 16,51 4,49 20,14 
10 16 18,76 — 2,16 7,63 
11 19 17,92 1,08 1,17 
12 21 21,90 — 0,90 0,81 
13 25 22,71 2,29 5,27 
14 21 20,76 0,24 0,06 
Somme 0 67,45 


La matrice des variances et covariances estimées des coefficients nous est donnée 


par [7], soit : 
Q; =62(X' X)°! 
20,16864 0,015065 —0,23145  —0,07617 
ê. — 6,745 x 0,015065 0,013204 0,001194  —0,00094 


—0,23145 0,001194 0,003635 0,000575 
—0,07617  —0,00094  —0,000575 0,000401 


Les variances des coefficients de régression se trouvent sur la première diagonale : 


Ce 6,745 x 20,17 —136,04 — 6; = 11,66 
Ce 6,745 x 0,013 — 0,087 — Gi — 0,29 
62 6,745 x 0,0036 — 0,024 — G 0,15 
62 6,745 x 0,0004 —  0,0026 — 6:33 — 0,05 


4) Le calcul du R? est effectué à partir de la formule [9]. 
Nous connaissons e’ e — 67,45, il convient de calculer DC — 3)? = 226,86. 
3 
> 
67,45 


R=1 | =] 2 — 0,702 
D Gr) 226,86 
t 


Le R° corrigé est donné par [11]: 


Ron 4 pe ll 6660 
E n—k—1 14 —4 
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Nous observons la baisse du coefficient de détermination lorsque nous le corrigeons 
par le degré de liberté. 


es tests statistiques 


e rôle des hypothèses 


L'hypothèse de normalité des erreurs implique! que : 


2 
2° CA 6: 
= =(i-k-1)==m-k-1)— [12] suit une loi du x? (chi-deux) à 
o © 


€ € ai 


n — k — 1 degrés de liberté (somme au carré de n — k - 1 variables aléatoires indé- 
pendantes normales centrées réduites). 


Il en résulte que : 


mn — 5 nt Z 4 D : 
—> ——— (l'écart type théorique est remplacé par l’écart type empirique) suit 
une loi de Student à n — k — 1 degrés de liberté. 


_ 


dj — à; 


& — à; Oä; > : 
En effet, ——— — | est le rapport d’une loi nor- 


Oä; CA 1 
p—k-1) + 
( 162 {n—k—1) 
male centrée réduite à la racine carrée d’un chi-deux divisé par son degré de 
liberté. 


(@—a);'(à— a) suit une loi du x? (chi-deux) à k+1 degrés de liberté 
(somme au carré de k + 1 variables aléatoires normales centrées réduites, les 
k + 1 coefficients). 


Si on remplace la matrice des variances covariances théoriques des coefficients, par 


G-a)@;'@-a) 


; ES . 7e 1 
son estimateur Q; = 6°/(X/X) !, la loi de probabilité de PR 
est alors un Fisher à k& + 1 et n — k — 1 degrés de liberté. 


1. L'ensemble de ces résultats sont une généralisation à k variables explicatives des résultats pré- 
sentés au chapitre 2, paragraphe lI.B. 
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@-a)[o(X'x)] @-a) 


En effet, F = LL . I est le rapport de deux 
© 
k — 1) — 
@ de Get) 


chi-deux divisés par leurs degrés de liberté (caractéristique d’une loi de Fisher à 
k + 1 et n — k — 1 degrés de liberté). 


onstruction des tests 


À partir des différentes relations définies ci-dessus, nous pouvons mettre en 
place un certain nombre de tests statistiques que nous allons expliciter. 


1) Comparaison d'un paramètre 4, à une valeur fixée a 


Le test d’hypothèses est le suivant : 
HO : dj = a 
H1 : d; £ a 


Nous savons que : 


© © suit une loi de Student à n — k — 1 degrés de liberté. 
Di 


Sous l’hypothèse HO, cette relation devient! : 


(& — al 


—— = 1; — loi de Student 7 — k — 1 degrés de liberté [13] 
Oäi 


Si 1% > 1%/%, alors nous rejetons l’hypothèse HO, a; est significativement 


différent de a (au seuil de «). 


Si ri <1%/%_, alors nous acceptons l'hypothèse HO, a; n’est pas significati- 
vement différent de a (au seuil de «). 


Cas particulier : test par rapport à une valeur particulière a = 0. 


Si nous désirons savoir si une variable explicative figurant dans un modèle 
est réellement — significativement — contributive pour expliquer la variable endo- 
gène, il convient de tester si son coefficient de régression est significativement 
différent de 0 pour un seuil choisi, en général & = 5 %. 


1. Comme il s’agit d’un test bilatéral, on calcule la valeur absolue du * empirique. 
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La relation [13], sous HO (a; = 0), devient : 


= 1; — loi de Student à n — k — 1 degrés de liberté [14] 
Di 


test appelé le ratio de Student, les règles de décision citées plus haut s’appli- 
quent alors. 


Ce test est très important ; en effet, si dans un modèle estimé, un des coeffi- 
cients (hormis le terme constant) n’est pas significativement différent de O, il 
convient d’éliminer cette variable! et de ré-estimer les coefficients du modèle. 
La cause de cette non-significativité, est due : 


— soit à une absence de corrélation avec la variable à expliquer, 


— soit à une colinéarité trop élevée avec une des variables explicatives. 


2) Comparaison d'un ensemble de paramètres 
à un ensemble de valeurs fixées 


Nous cherchons à tester simultanément l'égalité d’un sous-ensemble de coeffi- 
cients de régression à des valeurs fixées. 


H:a,=a, 


q étant le nombre de coefficients retenus, c’est-à-dire la dimension de chacun 
des vecteurs a,. 


1 = : À ; 
Nous avons démontré que Frs r@ — a) Q;'(@ — a) suit une loi de Fisher à 
k+1 et n — k — 1 degrés de liberté ; pour un sous-ensemble de paramètres g, 
L 2 Au x : ; : . 
l'expression 4% : aa, (&;, — 4) Suit alors une loi de Fisher à g et 
n — k — 1 degrés de liberté. 
Pour accepter HO, il suffit que : 


Gy — à) < Fin —k—1) [15] 


äq.q 


1 = 
-@, = a) Q:! 
q 


F*(q,n—k— 1) = loi de Fisher au seuil & à g et n — k — 1 degrés de liberté. 


1. En effet, elle n’apporte aucune contribution et dégrade l’estimation des autres variables. 
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3) Intervalle de confiance de la variance de l'erreur 


L’intervalle de confiance de la variance de l’erreur permet de déterminer une 
fourchette de variation de l’amplitude de l’erreur. Pour un intervalle à (1 — «)%, 
il est donné par : 


[16] 


2 2 


IC = = Do. (n —k— De] 
Xi X2 


Avec x? à n — k — 1 degrés de liberté et «/2 de probabilité! d’être dépassée 
et x? à n—k—1 degrés de liberté et (1—/2) de probabilité d’être 
dépassée. 


ests sur les résidus : valeur anormale, effet de levier 
et point d'influence 


Nous n’abordons pas ici les tests sur les résidus remettant en cause les hypo- 
thèses d’homoscédasticité ou d’indépendance, qui sont traités au chapitre 5, 
mais trois notions qui sont proches et néanmoins différentes dans leur consé- 
quence sur l’estimation des paramètres du modèle et leurs précisions. 


1) La matrice HAT 


La matrice « HAT? », notée H, joue un rôle essentiel dans la détection de l’effet 
de levier. 


Nous calculons la matrice « HAT » H = X(X'X) !X. 

Les éléments de la première diagonale de cette matrice H sont appelés les 
leviers, qui déterminent l’influence de l’observation à sur les estimations obte- 
nues par la régression. 


Le levier est situé sur la première diagonale de cette matrice soit 
h; —= x(X'X) x! 


n 
Deux propriétés : 0 < h; < 1 et D h; = k +1, la somme des éléments de 
i=1 
la première diagonale de la matrice H est égale au nombre de paramètres esti- 
més du modèle. 


1. Attention, la loi du chi-deux n’est pas symétrique, il convient donc de lire sur la table les deux 
probabilités 1 — æ/2 et «/2. : 

2. Cette matrice permet de passer du vecteur Y au vecteur Y d’où le nom de matrice HAT (chapeau 
en anglais), en effet nous avons Ÿ = Xà = X(X'/X) !X'Y = HY. 
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Si chaque observation pèse le même poids, alors les valeurs des h; doivent 
k+1 


être proches de 


; : : k+1 
Le levier d’une observation i est donc anormalement élevé si : h; > 2 : 
n 


l’observation est alors considérée comme un point de levier (/everage point) ou 
point d’influence. 


2) Point de levier et valeur anormale 


Une observation exerce un effet de levier si elle est éloignée des autres en 
termes de combinaison des variables explicatives ; c’est-à-dire que les valeurs 
prises par les variables explicatives, pour cette observation de la variable à expli- 
quer, sont inattendues. Par exemple, un pays dont la population est faible mais 
le PIB élevé, chaque facteur explicatif pris individuellement n’est pas surpre- 
nant, mais la survenance de deux valeurs à la fois pour un pays est insolite. 


Le point d’influence est une observation qui contribue très fortement au pou- 
voir explicatif du modèle (sans cette valeur la régression peut être non signifi- 
cative !), l'observation pèse de manière exagérée dans la régression, au point 
que les résultats obtenus sont très différents selon que nous l’intégrons ou non 
dans la régression. 


La valeur prise par la variable explicative est anormale si le résidu de cette 
observation est beaucoup plus élevé que les autres résidus, pour identifier une 
valeur anormale nous pouvons calculer le résidu standardisé (ou encore appelé 
le résidu studentisé). Une autre approche permettant de détecter des valeurs 
anormales à l’aide de variables indicatrices sera présentée dans ce chapitre à la 
section V. 


3) Résidu standardisé (ou studentisé) 


Les résidus standardisés! notés eŸ permettent de détecter des valeurs anor- 


males. Le résidu e; est divisé par son écart type estimé pondéré par le levier? : 


e; 
S L . . En » . » 
e? = ——— suit une loi de Student à n — k — 1 degrés de liberté, avec 
" 6,91—h; 
Da 
Ge = ,| ————. Si, par exemple, les résidus standardisés eŸ sont compris 


n—k—1 
: 0,025 : 
dans l’intervalle + £,';°,, on ne suspecte pas de valeurs anormales pour un seuil 
de confiance 95 %. 


1. Dans cette méthode de calcul nous parlons de résidus studentisés internes car le calcul porte sur 
l’ensemble des observations. 


x de 4 L ei LL : 
2. Certains auteurs divisent le résidu par son écart type eÿ = — sans intégrer la valeur du levier. 
Ce 
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Il est aussi possible de calculer des résidus studentisés externes, ils sont cal- 
culés de la même manière mais en excluant du calcul l’observation i. 


Exercice n° 2 


LL, fichier C3EX1 


Tests statistiques sur les coefficients et la variance de l’erreur : calcul 
des leviers et des résidus studentisés 


En reprenant les données du tableau 1 et les résultats de l’exercice 1, on demande de 
répondre aux questions suivantes : 


1) Les variables explicatives sont-elles significativement contributives pour expliquer 
la variable endogène ? 


2) Le coefficient a, est-il significativement inférieur à 1 ? 


3) Les coefficients a, et a sont-ils simultanément et significativement différents de 
let-0,5 ? 


4) Quel est l’intervalle de confiance pour la variance de l’erreur ? 
5) Calculer les leviers et les résidus standardisés, existe-t-il des valeurs aberrantes ? 


(Les seuils choisis seront de 5 %.) 


Solution 


1) Il convient de calculer les trois ratios de Student et de les comparer à la valeur lue 
dans la table pour un seuil de 5 % (la table de Student en fin d’ouvrage indique direc- 
tement les valeurs de œ pour un test bilatéral). 


D’après [14], nous obtenons : 


en 0,80 0.05 . re 
=— = 029 = =2,175>t6 = 2,228 — a £ 0, la variable explicative x, est 
Oä1 ; 


contributive à l’explication de y ; de même : 


 _|-038| , 
= | RE | = à, = 2,53 > 197 = 2,228 —+ a £ 0 
ä _|-0,03| , 
à | 0,05 | = 13 = 0,60 < D = 2,228 —+ a = 0 


la variable x, est explicative de y alors que la variable x; n’est pas contributive à 
l’explication de y, il convient donc de la retirer de ce modèle et de procéder à une nou- 
velle estimation. 


Nous aurions pu tout aussi bien répondre à cette question en calculant les intervalles 
de confiance de chacun des coefficients : 
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IC = à +18 Ga = 0,80 + 2,228 x 0,29 = [0,14; 1,45] 
De même nous obtenons : 
IC =1[-0,71; —0,04] et 1Cy3 = [-0,14; 0,08] 


La valeur 0 n’appartient pas à l’intervalle de confiance à 95 % de a; et a, donc ces 
deux coefficients sont significativement différents de 0 ; en revanche, 0 appartient à l’in- 
tervalle de confiance de a;, ce coefficient n’est pas significativement différent de 0. 


2) Nous posons le test d’hypothèses suivant : 


H:a =1 
H1:a <1 


Sous HO, la relation [13] s’écrit : 


&—a  0,80—1 | 
Ga T 02 — 0,68 > —1% = —1,81! — acceptation de HO 


Nous sommes bien dans la zone d’acceptation de HO (cf. graphique 4 du chapitre 2). 


Par souci de simplification, nous pouvons procéder au test de Student en profitant 
de la symétrie de cette loi, soit à calculer : 
l& —al _ 10,80—1 


— = = 0,68 < 100 — 1,81 = tation de HO 
A 0.29 <t5 acceptation de 


Le fait de raisonner sur la valeur absolue du numérateur entraîne une lecture direc- 
te de la table et ainsi une construction et interprétation immédiate du test. 
3) Le test d’hypothèses est le suivant : 


Ho Cn 
n:()# (05) 


Examinons les différents éléments de la relation [15] sous HO : 


1 PR 
3% — &q) Q (q — 4) 


_ , 1 ; ; 
Nous avons : qg = 2, 4 = ( : et dy = ( o ;) . La matrice des variances 


et covariances des coefficients a été calculée lors de l’exercice 1, nous ne retenons que 
la sous-matrice de dimension 2 x 2 correspondant aux deux coefficients de régression 
faisant l’objet du test. 


0,013204 _ = 11,57140 eo) 


Lu di te 0,003635 #4 —3,80213  42,03506 


1. Attention, le test est unilatéral, il convient de lire sur la table de Student tabulée pour &/2 à un 
seuil de 0,10 = 2 x 0,05. 
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il 11,57140 — 21 1 
F2 3 O0 15 038409 ( © :) ) 


—3,80213  42,03506 — 0,38 +0,5 


F* = 0,612 est à comparer à F“(q,n — k— 1) = Fe = 4,10, le F* empirique est 
inférieur au F lu dans la table, on accepte l’hypothèse H0. Les données ne sont pas 
incompatibles avec la possibilité que les coefficients a, et a soient simultanément et 
respectivement égaux à 1 et —0,5. 


4) L’intervalle de confiance de la variance de l’erreur à un seuil (1 — «)% = 95% 
(œ = 0,05) est calculé à partir de la formule [16] pour 10 degrés de liberté : 


IC = fn —k— 1) 62 ._@—k- 1)62 = È x 6,745 10 x | 
X0,05 | XG 975 20,48 3,25 


Soit 3,30 < o2 < 20,75. La variance vraie (mais inconnue) o? de l’erreur a 95 % de 


chance de se situer à l’intérieur de cet intervalle. 


5) Le calcul de h; et des résidus standardisés sont effectués à l’aide du programme 
C3EX2.PRG. Les résultats sont présentés sur le tableau 3. 


Tableau 3 — Valeur des leviers h; et des résidus standardisés e 


S 


i 


Résidus 

i ei h; ei 

1 — 0,8408 0,2790 — 0,3813 

2 1,6068 0,2966 0,7377 

3 — 3,1800 0,3091 — 1,4732 

4 1,6055 0,3248 0,7523 

5 — 3,6973 0,2609 — 1,6559 

6 1,1220 0,1825 0,4778 

7 — 1,2015 0,5327 — 0,6768 

8 0,1426 0,2025 0,0615 

9 4,4880 0,1804 1,9088 

10 — 2,7622 0,1442 — 1,1497 

11 1,0830 0,3066 0,5008 

12 — 0,8994 0,2115 — 0,3900 

13 2,2946 0,4086 1,1489 

14 0,2387 0,3605 0,1149 

y : k+1 : 
Le seuil du levier est égal à 0 : 4 = 0,57, aucune valeur n’est supérieure 


à 0,57, nous ne détectons pas de point de levier (ou de point d’influence). 


Les résidus studentisés sont tous dans l’intervalle + f 
tons pas de valeur anormale. 
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0,025 
10 


= + 2,228, nous ne détec- 


analyse de la variance 


onstruction du tableau d'analyse de la variance 
et test de signification globale d'une régression 


Dans cette section, nous allons nous interroger sur la signification globale du 
modèle de régression, c’est-à-dire si l’ensemble des variables explicatives a une 
influence sur la variable à expliquer. Ce test peut être formulé de la manière 
suivante : existe-t-1l au moins une variable explicative significative ? Soit le test 
d’hypothèses : 


HO: a =a; =... a = 0 (tous les coefficients sont nuls!) 
H1 : il existe au moins un des coefficients non nul 


Nous ne testons pas le cas où le terme constant a, est nul, car seules nous 
intéressent les variables explicatives. Un modèle dans lequel seul le terme 
constant est significatif n’a aucun sens économique. 


Le cas où l’hypothèse HO est acceptée signifie qu’il n’existe aucune relation 
linéaire significative entre la variable à expliquer et les variables explicatives (ou 
encore que la Somme des Carrés Expliqués n’est pas significativement différen- 
te de O). 


Nous reprenons l’équation fondamentale [8] d’analyse de la variance : 
DG-» = G-3» +3 2e 


La régression est jugée significative si la variabilité expliquée est signi- 
ficativement différente de 0. Le tableau 4 présente le tableau d’analyse de la 
variance? permettant d'effectuer le test de Fisher. 


 — >) /k 
: 26 7) / : _. 


Lt 


* 


(d’après [91 
[17] 


1. Nous remarquons que nous pouvons répondre à cette question par le test d’un sous-ensemble 
de coefficients [15], le test ici présenté conduit évidemment à des résultats identiques. 


2. Voir chapitre 2, paragraphe 4, pour la construction de ce tableau. 
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Tableau 4 — Analyse de la variance pour une régression multiple 


Source de variation Somme des carrés Degré de liberté Carrés moyens 
X1s Xe, XE SCE=N G-53) k SCE/k 
f 
Résidu SCR=N € n—k-1 SCR/(Nn—k—1) 
k 
Total SCT = DC —7Y n—]1 
t 


L'hypothèse de normalité des erreurs implique que sous l’hypothèse HO, F* 
suit une loi de Fisher (rapport de deux chi-deux). Nous comparons donc ce F* 
calculé au F théorique à k et (n — k — 1) degrés de liberté : si F* > F nous reje- 
tons l’hypothèse HO, le modèle est globalement explicatif. 

Dans la pratique, ce test est effectué immédiatement grâce à la connaissance 
du coefficient de détermination R? (seulement si le modèle comporte un terme 
constant) qui permet de calculer le Fisher empirique (calculé). 


utres tests à partir du tableau d'analyse 
de la variance 


À partir d’un exercice, nous allons présenter quatre tests usuels se référant à 
l’analyse de la variance, la généralisation de ces tests ne posera par la suite aucu- 
ne difficulté au lecteur. 


1) Introduction d'une ou de plusieurs variables explicatives 
supplémentaires 


L’ajout d’un bloc supplémentaire de variables explicatives améliore-t-il signifi- 
cativement la qualité de l’ajustement ? 


2) Stabilité des coefficients du modèle dans le temps (test de CHOW) 
Peut-on considérer le modèle comme étant stable sur la totalité de la période, ou 
bien doit-on considérer deux sous-périodes distinctes d’estimation (changement 


structurel du modèle) ? La spécification du modèle est la même, mais les valeurs 
estimées des coefficients pour les deux échantillons sont différentes. 


3) Test de restrictions et de contraintes sur les coefficients 


Les contraintes souhaitées ou envisagées sur les coefficients sont-elles justifiées 
et validées par l’estimation économétrique ? 
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4) Augmentation de la taille de l'échantillon servant à estimer le modèle 


Lorsque la taille de l’échantillon aug mente (le nombre d’observations à dispo- 
sition est plus important), le modèle reste-t-11 stable ? Ce test se ramène au test 
de Chow de stabilité des coefficients sur deux sous-périodes. L’estimation sur la 
sous-période 1 est effectuée à partir de l’échantillon initial et l’estimation de la 
sous-période 2 à partir des nouvelles observations. 


Nous voyons l'intérêt pratique de ces tests et l’apport pour l’économiste des 
réponses à ces questions. 


Exercice n° 3 


LL, fichier C3EX1 


Tests à partir de l’analyse de la variance 


En reprenant les données de l’exercice 1 (tableau 1), dont nous rappelons les résul- 
tats de l’estimation du modèle! : 


Jr = 32,89 + 0,80 x1, — 0,38 x, — 0,03 x3; +e, 
(11,66) (0,29) (0,15) (0,05) 


R? = 0,702 
n = 14 
(-) = écart type des coefficients 


on demande de tester les hypothèses suivantes. 


1) L’ajout des variables explicatives x, et x; améliore-t-il significativement la qualité de 
l’estimation par rapport à x, seul ? 


2) Peut-on considérer le modèle (à trois variables explicatives) comme stable sur l’en- 
semble de la période, ou doit-on procéder à deux estimations, l’une de la période 1 à 
7, et l’autre de la période 8 à 14 ? 


3) Un économiste suggère que dans ce modèle a; = 1 et a = a3, qu’en pensez-vous ? 


Solution? 


Nous pouvons tout d’abord appliquer le test de Fisher [17] afin de tester la signifi- 
cation globale de la régression à trois variables x, x2 et x3. 


: R?/k __ 0,702/3 
7 (—R2)/n—-k—1)  (1—0,702)/10 


* 


= 7,878 > F6 = 3,71 


1. Le lecteur notera la présentation « standard » des résultats d’estimation d’un modèle. Les infor- 
mations listées ici doivent impérativement figurer. À noter que le { de Student est souvent indi- 
qué à la place de l’écart type des coefficients afin de pouvoir, sans aucun calcul, procéder aux 
tests de significativité des coefficients. 

2. Les calculs sont effectués à partir d’un logiciel, il peut apparaître de légères différences entre 
les calculs manuels et les résultats, imputables au fait que le logiciel tient compte d’un nombre 
élevé de décimales. 


Le modèle de régression multiple e 69 


Nous rejetons l’hypothèse HO de nullité de tous les coefficients, la régression est 
globalement significative. 


1) Test d’ajout de variables 


Étape 1: calcul de la variabilité totale, expliquée et résiduelle sur le modèle complet. 

Les résultats calculés précédemment lors de l’exercice 1 nous ont donné : 

SCT = D (y — 7) = 226,86; SCE = D G — y) = 159,41; 
n ’ SCR=e e=67,45 


Étape 2 : calcul de la variabilité totale, expliquée et résiduelle sur le modèle à une seule 
variable explicative x1. 


Le modèle estimé est le suivant : 


= 1,01lx::+11,57+e, 


(0,281) 
n = 14 
R? = 0,52 
() = Ecart type 
G. — 3,0165 


Nous calculons d’abord 
SCR!'=e'e = ddl. x 6? = 12 x 3,0165? = 109,20 
puis à partir du coefficient de détermination R?, nous déduisons : 


SCT! = 226,86 et SCE! = 117,65 


Le test d’hypothèses est le suivant : 
HO : a = a; =0 
H1 : il existe au moins un des deux coefficients non nul. 

Ce test se ramène à un test par analyse de la variance : le fait d’ajouter des variables 
explicatives dans un modèle entraîne automatiquement une augmentation! de SCE 
(et donc une diminution de SCR) ; on souhaite donc tester que la différence entre SCE 
et SCE! soit significativement positive (ou bien que la différence entre SCR! et SCR 
soit significativement positive, il s’agit du même test). On compare donc la différence 
par rapport à la somme des carrés la plus faible, soit ici SCR. Le tableau 5 d’analyse de 
la variance permet de procéder au test de Fisher. 


Étape 3 : tableau d’analyse de la variance. 


Tableau 5 -— Tableau d'analyse de la variance pour tester l'ajout 
d’un bloc de variables explicatives 


Source Somme Degré Carrés 
de variation des carrés de liberté moyens 
X] SCE!= 117,65 1 117,65 
X1, X2, X3 SCE —=159,41 3 53,14 
Résidu SCR = 67,45 10 6,74 
Total SCT = 226,85 13 


1. Sauf si la ou les variables ajoutées sont orthogonales à la variable à expliquer, SCE reste alors 
identique. Ce cas est évidemment rare. 
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Étape 4 : calcul du Fisher empirique. 


E—SCE!)/(k—Kk 41,67/(3—1 
SCR/(n—k—1) 67,45/10 ; 


* 


(SCR'— SCR)/(k—k') _ (109,2 — 67,45)/2 
SCR/G—-k-1) 67,45/10 


Avec k — nombre de variables explicatives du modèle complet et k&' — nombre de 
variables explicatives du modèle sans l’ajout du bloc de variables. Nous acceptons l’hy- 
pothèse HO, il n’y a donc pas de différence significative entre les deux variances expli- 
quées, l’ajout des variables explicatives x, et x; n’améliore pas de manière significati- 
ve — au seuil de 5 % — le pouvoir explicatif du modèle. 


Ou encore : F* : = 3,09 


2) Le modèle est-il stable sur la totalité de la période ? 
Soit le modèle estimé sur une seule période : 
M = À Xi + D Xi + 3 Xy + do +e, pourt = 1,...,14 


ou le modèle estimé sur deux sous-périodes : 


= À Xi + x + xy + à +e, pour 1—=1,...,7 
22 22 22 22 
Ye = À Xi + @ Xn + dj Xy + 4j + e Pour ft = 8,..., 14 


Le test d’hypothèses jointes est alors le suivant : 


di = 4j = ai 
dj = 4 = 4; 
HO : 
d3 = 43 = 4j 
do = 44 = a 
Ce test de stabilité des coefficients (test de Chow) se ramène à la question suivante : 
existe-t-il une différence significative entre la somme des carrés des résidus (SC R) de 


l’ensemble de la période et l’addition de la somme des carrés des résidus calculée à par- 
tir des deux sous-périodes (SC R! + SCR?) ? 


En effet, dans le cas d’une réponse négative, cela signifie que le fait de scinder en 
deux échantillons n’améliore pas la qualité du modèle, donc qu’il est stable sur la tota- 
lité de la période. 


Les étapes sont alors les suivantes. 


Étape 1 : estimation du modèle sur chacune des deux sous-périodes! et calcul des 
sommes des carrés de résidus. 


sous-période 1 : données de 1 à 7 


» = 0,774x1, — 0,293x,; — 0,012x3, + 25,27 + e, 
(0,53) (0,31) (0,10) 


n 7 

R? — 0,692 

() = ÉEcart type 
G. — 3,01759 


1. Les deux sous-périodes peuvent être de longueur inégale, cependant elles doivent impérative- 
ment recouvrir la totalité des observations de la période. 
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Nous pouvons en déduire comme précédemment : 
SCT' = 88,85; SCE' — 61,54; SCR!' = 27,31 


sous-période 2 : données de 8 à 14 


» = 1,228x1, — 0,620x, — 0,184x3, + 62,63 + e, 
(0,69) (0,52) (0,15) 


n = 7 

R? — 0,543 

() = Ecart type 
6. — 2,6281 


D'où SCT? = 45,43; SCE? = 24,70; SCR? = 20,73. 
Étape 2 : calcul du Fisher empirique. 


En prenant au dénominateur la plus faible des sommes des carrés (soit 
SCR! + SCR?), le Fisher empirique est égal à : 


_ [SCR—(SCR!'+ SCR?)]/ddi, 
RE (SCR! + SCR?)/ddiy 


* 


avec ddl, =(n—-k—1)-[(n-k—-1)+(n-k-1)]=Kk+1—=4 
Can = +n 
ddl; = (nm -k-1)+(n -k-1)=n-2(k+1) =6 
d’où 
[(67,45 — (27,31 + 20,73))]/4 4,852 
7 (27,31 + 20,73)/6 8,00 


F* = 0,606 < F% = 4,53 


L'hypothèse HO est acceptée, les coefficients sont significativement stables sur l’en- 
semble de la période. 


Attention, en cas d’hétéroscédasticité (cf. chapitre 5), le test de Chow est biaisé dans 
le sens d’une surestimation du seuil de rejet du test, nous rejetons trop souvent l’hypo- 
thèse HO. 


3) Test de a, = 1 et a = az 
Si cette hypothèse est vérifiée, le modèle : 


Ye = do + Ai Xi + Go Xa + 43 Xy + Er 


peut s’écrire : 
Ve = Qo + Lis + 2 Xx + Go Xÿ + & 


ou Encore : 
Ve Xi = 00 + G(Xx + Xy) +6; 


Z = do + +E& 


Il convient de constituer la nouvelle variable à expliquer, z,, et la nouvelle variable 
explicative v,, puis d’effectuer la régression de z, sur v,. 
Le tableau 6 présente ces nouvelles variables. 


L’estimation des deux (k’ + 1) coefficients du modèle conduit aux résultats suivants : 
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z —= —0,0111v, +13,74+e, 


(0,051) 
n —= 14 
R? — 0,0389 
() — Ecart type 
G: — 3,0109 


Tableau 6 — Variables transformées sous l'hypothèse 
de vérification des contraintes 


t Z = Ye — X1r VU = Xay + Xy 
1 10 166 
2 13 175 
3 7 197 
4 10 192 
5 7 171 
6 11 197 
7 13 164 
8 14 180 
9 16 169 
10 8 201 
11 15 193 
12 12 203 
13 13 209 
14 14 209 


Nous pouvons en déduire : 
SCT'= 100,21; SCE"—0,428; SCR—:108,78 

L'hypothèse à tester est donc : 
HO : les restrictions sont toutes vérifiées (SCR! = SCR). 
H1 : il existe au moins une restriction non vérifiée (SCR! Z SCR). 
Le Fisher empirique est donné par : 
: (SCR! — SCR)/ddl, __ (08,78 — 67,45)/2 

SCR/(n—k—1) 67,45/10 
avec ddl, =(n—-k'—-1)-(n—-k—-1)=k—k —=2. 


L'hypothèse HO est acceptée, les contraintes envisagées sur les coefficients sont com- 
patibles avec les données. 


* 


= 3,06 SP 4,10 


énéralisation des tests par analyse de la variance 


Nous pouvons remarquer que tous ces tests par analyse de la variance se ramè- 
nent à un test unique, tel que les éléments du vecteur des coefficients a vérifient 
un ensemble de g contraintes linéaires : 
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HO : Ra =r 
H1:Ragr 
Ainsi le Fisher empirique est donné par : 
{RG —r)[R(X' X) TRI (Ra —r)}/q 
. SCR/n=k=—1) 
où à est le vecteur des coefficients estimés sur le modèle non contraint. 


F* 


On rejette HO si le F* est supérieur au F lu à g et n — k degrés de liberté. 
Quelques exemples d’utilisation pour un modèle à 4 variables explicatives : 


— Test sur un coefficient de régression. Hypothèse HO : a; = 0,5. 


Soit à tester l’égalité du 3° coefficient par rapport à 0,5 ; la contrainte s’écrit 
Ra = r avec R = (000 1...0 0 0) et r = (000 0,5...0 0 0). Le premier élément 
des vecteurs correspond au terme constant a. Ce test peut aussi être mené par 
un classique test de Student. 


— Test d'égalité de coefficients. Hypothèse HO : a; = a; — a; — a; =0. 
La contrainte s’écrit Ra = r avec R=(010—-1...000) 
etr—(0000...000). 


— Test de significativité globale de la régression. 


Hypothèse HO : a = a; = a; =... = a =0. 
Ce test de Fisher (cf. équation [17]) est équivalent à l’écriture contrainte Ra = r 
avec R=(0111...11)etr =(0000...000). 
De manière équivalente, nous pouvons utiliser la statistique : 
_ (SCR. — SCR)/q 
7 SCR/(n—-k-1) 
modèle contraint. 

Une autre manière de procéder consiste à comparer le ratio de vraisem- 


* 


où SCR. est la somme des carrés des résidus du 


blance! du modèle contraint et non contraint : si la contrainte est valide, nous 
devons avoir L,. < L,. où L,. est la fonction de vraisemblance du modèle non 
contraint et L,. est la fonction de vraisemblance du modèle contraint. Soit 
L./Lx <1, Sous forme logarithmique Ln(L,) — Ln(L,.) <0 ou encore 
L. — 1x < 0, la différence entre les logarithmes des fonctions doit être significa- 
tivement négative. On démontre que ce test se ramène à un test du x? par calcul 
de la statistique LR = —2(1, — 1.) qui suit un x? à r degrés de liberté (r étant 
le nombre de contraintes). Ainsi, si LR est supérieur au x? lu dans la table au 
seuil œ choisi et à r degrés de liberté, on rejette l'hypothèse HO, les restrictions 
ne sont pas vérifiées. 

Enfin, nous pouvons citer le test du multiplicateur de Lagrange (« LM test ») 
fondé sur l’estimation d’une équation intermédiaire et de la valeur d’une statis- 
tique LM = n x R°(n = nombre d’observations et R? = coefficient de détermi- 


1. Dans un modèle de régression classique, la maximisation de la fonction de vraisemblance four- 
nit des estimations identiques à celle de la méthode des MCO. 
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nation issu de l’estimation de l’équation intermédiaire) qui suit un x? à r degrés 
de liberté (r étant le nombre de contraintes) ; nous verrons des applications de 
cette statistique au chapitre 5 concernant les tests de détection de l’autocorréla- 
tion des erreurs et de l’hétéroscédasticité. 


‘utilisation de variables indicatrices! 


onstitution et finalités des variables indicatrices 


Une variable indicatrice est une variable explicative particulière qui n’est com- 
posée que de 0 ou de 1. Cette variable est utilisée lorsque, dans un modèle, nous 
désirons intégrer un facteur explicatif binaire : « le phénomène a lieu ou n’a pas 
lieu » pour corriger, par exemple, d’une valeur anormale ; ou bien lorsque le fac- 
teur explicatif est qualitatif : « le genre d’un individu, homme ou femme ». Il 
s’agit donc d’incorporer une ou des variables explicatives supplémentaires au 
modèle spécifié initialement et d’appliquer les méthodes classiques d’estima- 
tion. 

Le modèle de régression diffère selon l’apparition du phénomène par les valeurs 
d’un ou plusieurs coefficients alors que les autres paramètres sont identiques. En 
cas de modification structurelle d’un coefficient de régression, la variable muette 
affecte alors le coefficient de la ou des variables explicatives considérées. 

Par exemple, soit le modèle à deux variables explicatives x, et x, : 


Ye = do + Xi + GX + boD, + bi D,x1 + D Dix, + &, 
S1 le phénomène existe, D, = 1 et D, = 0 sinon. 
Si D, = 0, le modèle s’écrit : y, = ao + &iXx + GX + & 
Si D, = 1, le modèle s’écrit : y, = (ao + bo) + (ai + bi)xs, + (a + b,)x:, + 8, 
S1 b, = b, = 0, le modèle ne diffère que par la valeur du terme constant. 


Domaine d'utilisation des variables indicatrices. 


Le domaine d’utilisation des variables indicatrices est très vaste, nous pou- 
vons citer : la correction des valeurs anormales (cf. exercice n° 4), la modifica- 
tion structurelle (0 pour la période avant le changement structurel, 1 après le 
changement structurel), l’intégration de la saisonnalité (cf. exercice n° 6), la 
caractérisation d’un individu (genre, situation matrimoniale...) l'intégration de 
facteurs qualitatifs (appartenance d’un pays à la zone euro, promotion non quan- 
tifiable..….), etc. 


1. Les termes de variables indicatrices, de variables auxiliaires ou de variables muettes sont indif- 
féremment employés en français. Le terme anglo-saxon dummy est le plus couramment 
utilisé. 


Le modèle de régression multiple e 75 


xemples d'utilisation 


1) Correction de valeurs anormales 


Les séries statistiques sont parfois affectées de valeurs anormales liées à la sur- 
venance d’événements exceptionnels : grève, guerre, aberration climatique, etc. 
Deux problèmes se posent alors : détecter la valeur anormale et la corriger afin 
qu’elle ne perturbe pas l’estimation statistique des autres variables. 


Exercice n° 4 


Détection et correction de valeurs anormales par variable indicatrice 


Un modèle de production de service du secteur du tourisme est spécifié de la maniè- 
re suivante : 


OPS, = ao + a: VA; +æ@POP,+e, 
avec : 


QPS, — production du secteur tourisme pour l’année f ; 


VA, — valeur ajoutée du secteur tourisme pour l’année f ; 
POP, 


population pour l’année f. 
L’économètre chargé de l’estimation de ce modèle sur 18 ans s’interroge sur la per- 


turbation entraînée par l’effet d’une guerre pour l’année 16. Pour répondre à cette ques- 
tion, il intègre à son modèle de base une variable indicatrice D, tel que : 


D; =0 pourt=1à15ett = 17 à 18 


D, = 1 pour ft = 16 


L’estimation du modèle économétrique est la suivante : 


QPS, — 2340,4+ 23,5 VA, +0,3 POP, — 120,56 D, +e, 
(4,5) (2,2) (2,9) (5,8) 
n —=18 
R? = 0,65 


() = t de Student 


L'effet « guerre » a-t-il une influence significative sur la production du service du 
secteur du tourisme ? 
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Solution 


La variable indicatrice D, a un ratio de Student de r* = 5,8 > E = 2,14, le coef- 
ficient de régression de cette variable est significativement différent de O, la production 
de service pour l’année 16 est donc anormalement basse (—120,56) . Cette baisse est, 
sans doute imputable à l’effet de la guerre. 


+ Généralisation 


Dans le cas d’un phénomène se produisant de manière sporadique, la variable indi- 
catrice prend la valeur 1 pour la ou les périodes que l’on désire corriger et O0 pour les 
autres. 


Nous remarquons que nous pouvons procéder au test de Chow (stabilité du modèle 
sur l’ensemble de la période) en recourant à une variable indicatrice prenant la valeur 1 
pour la première sous-période et la valeur 0 pour la deuxième sous-période. Le test de 
Student portant sur le coefficient de la variable indicatrice permet alors de se détermi- 
ner sur un modèle à un régime ou un modèle à deux régimes. 


2) Variable qualitative 


Il peut s’avérer important dans certaines spécifications de modèle de tenir comp- 
te de l’effet, sur la variable endogène, de variables qualitatives : être titulaire 
d’un diplôme, genre d’un individu, appartenance politique, etc. L'utilisation 
d’une variable indicatrice permet de segmenter les individus en deux groupes et 
de déterminer si le critère de segmentation est réellement discriminant. 


NS 


Attention, dans le cas de variables qualitatives à plusieurs modalités, par 
exemple la couleur des yeux (bleu, vert, marron, autres), ou bien la situation 
familiale (célibataire, marié, divorcé, veuf, autres), etc. Il convient alors de 
coder autant de variables indicatrices que de modalités moins une. En reprenant 
l’exemple de la couleur des yeux nous définissons trois variables indicatrices : 
bleu (= 1 si l’individu à les yeux bleus, 0 sinon), vert (= 1 si l’individu à les yeux 
verts, 0 sinon), marron (= 1 si l’individu à les yeux marrons, 0 sinon), le cas des 
autres individus n’appartenant pas à l’une des trois premières catégories est 
implicitement contenu dans le terme constant. Une erreur à ne pas commettre 
consiste à créer une seule variable explicative codée, par exemple, de la maniè- 
re suivante : bleu = 1, vert = 2, marron = 3, 

Au chapitre 12 nous traitons du cas particulier des variables qualitatives qui 
figurent en tant que variables à expliquer. 
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Exercice n° 5 


Intégration d’une variable qualitative 


Afin de déterminer les facteurs explicatifs de la réussite de la licence en sciences 
économiques, on spécifie le modèle suivant : 


NL = a +a ND +a DS +e 


Où : 

NL = note moyenne obtenue en licence, 

ND = note moyenne obtenue en fin de deuxième année, 

DS = variable indicatrice de genre (1 pour les hommes et 0 pour les femmes). 


L’estimation à partir d’un échantillon de 60 étudiants conduit aux résultats suivants : 


NL =8,5+0,3ND-—-1,2DS+e 
(4,5) (7,1) (2,3) 

n —=60 

R? —=0,72 

() —=1 de Student 


Le fait d’être homme ou femme a-t-il une influence sur la note obtenue en licence 
de sciences économiques ? 


Solution 
La variable indicatrice DS a un ratio de Student de 
= 2,3 > 190 = 1,96 


le coefficient de régression a est significativement différent de 0, le facteur sexe est 
donc bien un facteur discriminant de la note obtenue en licence. La probabilité critique, 
associée au risque de première espèce (risque de rejeter l’hypothèse HO à tort), est égale 
à 0,025. Nous avons donc 2,5 % de risque de nous tromper en rejetant l’hypothèse HO. 
Le risque d’erreur est très faible, nous la rejetons. 

Il est à noter que le coefficient négatif indique qu’il est « pénalisant » d’être un 
homme (DS = 1) et qu’en moyenne, sur notre échantillon, les hommes ont une note 
inférieure de 1,2 point à celle des femmes. 

Toutefois le facteur explicatif le plus important reste bien la note obtenue en fin de 
deuxième année (1* = 7,1). 
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3) Analyse de saisonnalité 


Exercice n° 6 


LL, fichier C3EX6 


Étude de saisonnalité par variables indicatrices 


Une entreprise cherche à appréhender une relation entre ses ventes et ses dépenses 
publicitaires. Le directeur du marketing dispose des données (tableau 7) de ventes et de 
dépenses publicitaires sur 5 ans par trimestre. 


1) Ce directeur du marketing commence par estimer la relation : 
V, = ao + & Pub, +6; 
Commenter les résultats obtenus. 
2) Tracer le graphique de la série des ventes, que pouvez-vous en conclure ? 


3) Spécifier et estimer le modèle adéquat. 


Tableau 7 — Ventes et dépenses publicitaires 


Années T T T3 Ts 
1 Ventes 164 198 85 179 
Pub. 34. 36 32 29 
2 Ventes 168 201 98 197 
Pub. 45 67 76 75 
3 Ventes 197 209 100 216 
Pub. 75 78 72 75 
4 Ventes 223 245 119 260 
Pub. 78 81 84 83 
5 Ventes 298 309 124 267 
Pub. 89 82 81 83 
Solution 


1) L’estimation du modèle de régression simple 
V, = ao + ai Pub, +8, 
conduit aux résultats suivants : 


V, = 104,89 + 1,29 Pub, +e, 


(1,85) 
n —=20 


R? = 0,16 
() =1t de Student 
La publicité a-t-elle un effet significatif sur les ventes ? La valeur du ratio du Student 
empirique permet de répondre à cette question. 


= 1,85 < 19 = 2,10 — le coefficient a, n’est pas significativement différent 
de O, la publicité n’a pas, a priori, d’impact sur les ventes. 
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2) Le graphique 1 de la série des ventes et des dépenses publicitaires indique une série 
des ventes fortement saisonnière avec un creux très affirmé au troisième trimestre 
alors que la variable publicité ne semble pas affectée de variations saisonnières. 


La relation entre les ventes et la publicité ne peut être déterminée puisque le mou- 
vement saisonnier vient occulter l’estimation économétrique!. Il convient donc d’inté- 
grer ce mouvement saisonnier à l’aide de variables muettes. 


3) Le modèle tenant compte de ce mouvement saisonnier s’écrit : 
V, = 49 + à Pub, + a Di, + a3 Da + aa Ds + 6, 


avec Di, — variable indicatrice du trimestre 1 : cette variable est composée de 0, sauf 
pour les premiers trimestres pour lesquels la valeur 1 figure ; D;, — variable indicatrice 
du trimestre 2 : cette variable est composée de 0, sauf pour les deuxièmes trimestres pour 
lesquels la valeur 1 figure ; D3, = variable indicatrice du trimestre 3 : cette variable est 
composée de 0, sauf pour les troisièmes trimestres pour lesquels la valeur 1 figure. 


PA — Ventes brutes 


Publigité 


30 ”_ 
F EL PT ME EEE dd 
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Graphique 1 — Série des ventes et de dépenses publicitaires 


La variable indicatrice du quatrième trimestre ne doit pas être incorporée au modè- 
le. En effet, nous aurions dans le cas de son existence 


Di + Di + Dy + Da = U 


U étant le vecteur unité qui serait par construction colinéaire au vecteur unité du terme 
constant, ce qui rendrait la matrice X’ X singulière (non inversible). 


La valeur du coefficient saisonnier du quatrième trimestre est donc implicitement 
incorporée à la valeur du terme constant. 


Nous pourrions, dans une solution alternative, utiliser les quatre variables indica- 
trices et procéder à une régression sans terme constant. Les données utilisées pour l’es- 
timation sont présentées dans le tableau 8. 


L’estimation du modèle est la suivante : 
V, = 129,10 + 1,37 Pub, — 7,21 D,, + 8,87 D;, — 118,6 D3, +e, 
(3,97) (0,38) (0,47) (6,25) 


1. Dans un modèle économétrique, les variables doivent être non saisonnières ou Corrigées des 
Variations Saisonnières (CVS). 
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n —20 
R? = 0,83 
() =1t de Student 


Les dépenses publicitaires, dont le ratio de Student est égal 3,97, sont maintenant 
explicatives! des ventes ; la variable indicatrice D;, est la seule variable muette signifi- 
cative (1* = 6,25), ce qui implique que la saisonnalité des ventes est liée essentielle- 
ment au creux du troisième trimestre. 


Tableau 8 — Variables indicatrices 
pour une désaisonnalisation trimestrielle 


V, Pub, Di D; D; 
T; 164 34 1 0 0 
T; 198 36 0 1 0 
T; 85 32 0 0 1 
T, 179 29 0 0 0 
T; 168 45 1 0 0 
TD 201 67 0 1 0 
T; 98 76 0 0 1 
T, 197 75 0 0 0 
T\ 197 75 1 0 0 
T> 209 78 0 1 0 
T3 100 72 0 0 1 
Ts 216 75 0 0 0 
T; 223 78 1 0 0 
T 245 81 0 1 0 
T3 119 84 0 0 1 
T, 260 83 0 0 0 
T; 298 89 1 0 0 
D 309 82 0 1 0 
T3 124 81 0 0 1 
T, 267 83 0 0 0 


a prévision à l'aide du modèle 
linéaire général et la régression récursive 


rédiction? conditionnelle 


Le problème consiste à déterminer quelle valeur doit être attribuée à la variable 
endogène lorsque nous connaissons les valeurs des variables exogènes. 


1. Ceci est à noter : dans un modèle, l’absence d’une ou de plusieurs variables explicatives impor- 
tantes peut entraîner une mauvaise estimation des variables figurant déjà dans le modèle. 

2. Il ne s’agit pas toujours de prévoir une valeur dans le futur, mais dans le cadre de séries tem- 
porelles de simuler le passé ou bien dans les modèles en coupe instantanée de prédire des 
valeurs. 
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Le modèle général estimé est le suivant : 
Vs = do + di Xi + D Xx +... + dXx + € 


La prévision pour la donnée f + h (respectivement i + h pour les modèles en 
coupe instantanée) est la suivante : 


Vin = do + Ai Xirin + D Xoçin + + QEXxrtn 


L'erreur de prévision est donnée par : 


= 
Etth = Vith — Yith 


Considérant que les hypothèses du modèle linéaire général sont vérifiées, la 
prévision Ÿ,,, est sans biais. 


Nous avons postulé que nous connaissons sans erreur les valeurs en t+h 
des variables explicatives. Si pour un modèle en coupe instantanée cette hypo- 
thèse est réaliste, il n’en est pas de même dans les modèles en séries temporelles 
pour lesquelles les valeurs futures des variables explicatives sont estimées avec 
imprécision et donc introduisent un élément supplémentaire d’incertitude dans 
le calcul de la prévision. Ce problème est exclu du champ de notre analyse, 
puisque nous traitons de prédiction conditionnelle. 


iabilité de la prévision et intervalle de prévision 


L'erreur de prévision calculée en t à l'horizon h peut s’écrire aussi : 
Erth — Vith — Vian = X' y (a — à) + Eh 

Calculons la variance de cette expression : V(e;+1) = VX (a — à) + Erth) 
X',,(a — à) est une combinaison linéaire des y, et puisque &,,, est sans corréla- 
tion avec les y,, nous avons Cov(X/,,(a —&),8,,») = 0. 

On a alors : V(e;1p) = V(X.,,; (a — à)) + V(er+n) 

VX — à) = XV = àXou = of LA O Ko] 
(puisque V(à) = o?(X'X) !)) 

On connaît : V(£,:,) = 0? 

La variance de l’erreur de prévision est donc égale à : 


on = OX, (X A) Xin T 1] [18] 
1 
Xir+h 
Avec X,1n = | x, | Vecteur des valeurs prévues des variables explicatives. 
Xkr+h 
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Or l’erreur de prévision (e,,, = 3» — Ya) est distribuée suivant une loi nor- 
5 s Pie ; : s 
male N (0, 0,,,), en remplaçant la variance théorique 0, par la variance empi- 
rique 6? dans l’expression [18], nous pouvons en déduire que : 


Vin — Vin 
CLX 45 XX Xi + 1] 


suit une loi de Student à n — k — 1 degrés de liberté. 


Nous remarquons que, comme pour le modèle de régression simple, la va- 
riance de l’erreur de prévision est d’autant plus faible lorsque : 


— la variance résiduelle est faible : 


—les valeurs prévues des variables explicatives se rapprochent de leur 
moyennes. 


L’intervalle au seuil (1 — œ) de la prévision est alors : 


Von = Von EE VOX À XD Xe + I] [19] 


Exercice n° 7 
LL, fichier C3EX1 


Prévision à partir du modèle linéaire 
En reprenant les données de l’exercice 1 (tableau 1), on demande : 
1) d’estimer le modèle à deux variables explicatives : 


Y = do + di Xi + Q2 Xa + 6, (puisque nous avons montré que la variable x; n’est 
pas significative) ; 


2) de calculer une prévision et son intervalle à 95 % pour les périodes 15 et 16, sachant 
que : 


Xiis = 3; Xi16 — 6 et x215 — 24; X216 — 38 
Solution 
1) L’estimation du modèle à deux variables explicatives conduit aux résultats suivants : 


» = 25,84+0,715x1, — 0,328x, + e, 
(0,26) (0,13) 


n 14 
R? — 0,687 
() = ÉEcart type 
G, — 2,538 


Nous remarquons les t de Student supérieurs à 2,201, les coefficients a, et a sont 
significativement différents de 0. 


2) La prévision pour la période 15 est calculée à partir du modèle estimé : 
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is = 25,84 + 0,71 x115 — 0,33 x215 = 25,84 + 0,71 x 3 — 0,33 x 24 
is = 20,25 


De même, pour la période 16, on obtient : 

V6 = 25,84 + 0,71 X116 — 0,33 X216 = 25,84 + 0,71 x 6 — 0,33 x 38 

is = 17,26 

Les écarts types de l’erreur de prévision sont donnés par [18] : 

62: = 62[X/,(X' X) ! X15 + 1]. Nous devons calculer (X’ X) !, les autres élé- 
ments étant connus. 

14 85 532 

X'X=| 85 631 3126 | —(X'X) = 


532 3126 20666 
5,707687 —0,16341  —0,12221 


= | —0,16341 0,011001 0,002542 
—0,12221 0,002542 0,002809 

5,707687 —0,16341  —0,1222 1 
62,5 = (2,538)? | (1 3 24) | —0,16341 0,011001 0,002542 3 |+1 

—0,12221 0,002542 0,0022809 24 

62, = 6,44: [0,94 + 1] = 12,53 — Gus = 3,54 
De même, nous pouvons déterminer : 
26 = 6,44: [0,071 + 1] = 6,90 —+ Gus = 2,62 


Les intervalles de prévision peuvent être calculés par [19] : 


en = Dern +100 AXE A XV eur + 1] 
pis = Pis #15 1 * Gers = 20,05 + 2,201 x 3,54 
10 = [12,26 ; 27,84], la prévision pour la période 15 a 95 % de chances de se 
situer dans cet intervalle et la prévision de la période 16 : 
IC = [11,49; 23,03] 
Les intervalles de la prévision semblent assez larges, cependant il convient de sou- 
ligner que la distribution de probabilité suit une loi de Student et qu’à ce titre la valeur 


la plus probable demeure la valeur centrale (la prévision estimée) et que la probabilité 
d’apparition diminue lorsque l’on s’éloigne de cette valeur centrale. 


Nous remarquons que l’écart type de l’erreur de prévision de la période 16 est infé- 
rieur à celui de la période 15. Cela est la conséquence des valeurs des variables explica- 
tives pour la période 16 que nous avons choisies sensiblement égales à leur moyenne. 


es tests de stabilité par la régression récursive 


On appelle régression récursive la procédure qui consiste à estimer une succes- 
sion de régressions en augmentant progressivement le nombre d’observations. 
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On estime d’abord le modèle avec les k + 2 premières observations (modèle 
à un degré de liberté) puis on incorpore l’observation suivante et on re-estime le 
modèle, et ainsi de suite jusqu’à # (le nombre d’observations total disponible). 


Un simple examen graphique de l’évolution des coefficients du modèle — 
assortis de leurs intervalles de confiance à + deux écarts types — permet éven- 
tuellement de déterminer des changements structurels. 


— Les tests du « CUSUM » sont fondés sur la dynamique de l’erreur de 
prévision. 

Ces tests permettent de détecter les instabilités structurelles des équations de 
régression au cours du temps. Contrairement au test de Chow, ils ne nécessitent 
pas de connaître a priori la date de modification structurelle. L’idée générale de 
ces tests est d’étudier l’évolution au cours du temps de l’erreur de prévision nor- 
malisée, on appelle résidu récursif cette succession d’erreur de prévision calcu- 
lée en f — 1 pour t. 


Le résidu récursif w, au temps f est donc défini comme le rapport : 
— de l’écart entre la prévision calculée en r — 1 pour f et la réalisation en f, 
— et une variable d’échelle! calculée pour cette même période f, 


soit : 
he Ye — Xâr1 
= = 
% PET AE" 


avec 1t—=K +2,K +3,K +4,...,n(K =k+1 est le nombre total de para- 
mètres estimés du modèle). Ce résidu récursif suit donc une loi normale N(0,0?). 


Soit les deux tests : 


— le CUSUM (CUmulative SUM) fondé sur la somme cumulée des résidus 
récursifs, 


— le CUSUM SQ fondé sur la somme cumulée du carré des résidus récursifs. 
À partir du résidu récursif w,, on calcule la statistique CUSUM : 


avec {= K +2,...,n(K = k + 1 est le nombre total de paramètres estimés du 
modèle) et SCR la somme des carrés des résidus calculée à partir du modèle à n 
observations. 


S1 les coefficients sont stables au cours du temps, alors les résidus récursifs 
doivent rester dans l’intervalle défini par les deux droites : [K,+o4/n — K] et 
[n,+3o4/n — K] avec æ& = 1,143 — 0,948 et 0,850 respectivement pour des 
seuils de confiance de 1 %, 5 % et 10 %. Dans le cas contraire, le modèle est 
réputé instable. 


1. On remarque qu’il s’agit de la formule [18], hormis la variance résiduelle. 
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— La statistique du CUSUM SQ est donnée par le carré du résidu récursif : 


t 
2 
> w 
j=K+2 


S = — avect=K+2,...net0<sS,<1; 


j=K+2 


ce test permet de détecter des modifications aléatoires (ponctuelles) dans le 
comportement du modèle. Si les coefficients sont stables au cours du temps, 
alors les résidus récursifs carrés doivent rester dans l’intervalle défini par : 


He] 
n—K 
1 


où C'est la statistique de Kolmogorov-Smirnov. 


e test de spécification de Ramsey 


Le test de Ramsey, aussi appelé le test de RESET (Regression Error 
Specification Test), porte sur la pertinence de la forme fonctionnelle du modèle, 
telle que : 


— une relation fonctionnelle non adaptée (passage aux logarithmes, fonctions 
inverses.…) entre la variable à expliquer et les variables explicatives ; 

— l’absence d’une variable explicative dans le modèle ; 

— la corrélation entre la variable explicative et le terme d’erreur ; 


Plutôt que d’estimer des spécifications alternatives (par exemple linéaire ou non 
linéaire), le test porte sur la significativité d’un ou des coefficients d’une équa- 
tion intermédiaire dans laquelle figure la série à expliquer ajustée et élevée à la 
puissance 2, 3, 4... Le test RESET est mené en trois étapes : 


1) Estimation par les MCO du modèle initial et calcul de la série ajustée : 


Ye = do + Xi + dX2 +... + xx 


2) Estimation par les MCO de l’équation intermédiaire : 


= Do + bixi + Daxo +... + Dex + Da? + Da +... + biÿ" + v, 


1. Pour la table, cf. Johnston J. et Dinardo J., pages 379-380, 1999. 
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3) Test de l'hypothèse HO : g = #3 = ... = d, par un classique test de Fisher 
d’un sous-ensemble de coefficients (ou si h = 2, par un test de Student portant 
sur le coefficient unique, HO : ®, = 0). 

S1 l'hypothèse HO est acceptée, le modèle est bien linéaire et il n’existe pas 
de problème de spécification. 


Exercice n° 8 


LL, fichier C3EX1 


Tests de stabilité structurelle, Test de spécification de Ramsey 
Soit les données de l’exercice 1 (tableau 1) et le modèle : 
Ye = do + diXis + d2Xay + Es 
On demande : 


1) À partir d’une régression récursive de tester un éventuel changement structurel en 
examinant la stabilité des coefficients et en procédant aux tests CUSUM ; 


2) De procéder au test de spécifications de Ramsey. 
Solution 
1) Stabilité des coefficients 


Nous procédons à l’estimation des coefficients ao, ai et a2 avec leur intervalle de 
confiance à + deux écarts types, sur 4, 5, .…., 14 observations, soit 11 coefficients différents. 


Le programme Eviews (C3EX8) est en téléchargement. 


Les graphiques 2, 3 et 4 illustrent l’évolution des trois coefficients à partir de la sep- 
tième observation ; en effet compte tenu du degré de liberté très faible, l’estimation de 
l’écart type des coefficients (et donc l’intervalle de confiance) pour les trois premiers 
calculs n’est pas significatif. 


Graphique 2 - Évolution de ay et de son intervalle de confiance à + deux écarts types 
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F B él 1ù di 12 15 14 


0,4 


7 8 9 10 11 12 13 14 


Graphique 4 - Évolution de a et de son intervalle de confiance à + deux écarts types 
Nous constatons que les trois coefficients restent toujours dans leur intervalle de 
confiance, nous rejetons l’hypothèse d’un changement structurel. 
Tests CUSUM 
Les tests CUSUM et CUSUM SQ peuvent être effectués directement sur Eviews : 


[l à ——— 
dB GO F8 8 10 11 2 13 ‘4 


Graphique 5 — Test CUSUM pour un seuil de confiance de + 5% 
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1D 11 12 14 


Graphique 6 — Test CUSUM SQ pour un seuil de confiance de + 5% 


Hormis à la période 9 du test CUSUM pour laquelle nous constatons un — très léger 
— franchissement de l’intervalle de confiance, les statistiques CUSUM et CUSUM SQ 
restent dans leur intervalle ; là encore nous rejetons donc l’hypothèse d’un changement 
structurel. Ces résultats sont en conformité avec ceux de l’exercice n°3 (test de Chow). 


2) Le test de Ramsey est conduit de la manière suivante : 
— Calculer la série à expliquer ajustée : ÿ, = 25,84 + 0,71x1, — 0,33x, 


— Élever au carré la série à expliquer : ÿ2 = ($,)?, nous ne testons qu’une spécification 
non linéaire de type quadratique. 


— Estimer le modèle en ajoutant comme variable explicative supplémentaire ÿ? : 
M = bo + bixis + boxy + piŸ? +6, 


— Effectuer le test d’hypothèses HO : = 0 (H1 : # # 0). La probabilité critique du 
coefficient est égale à 0,827. Nous acceptons l’hypothèse HO, le modèle est donc cor- 
rectement spécifié. 


Le test de Ramsey peut être effectué directement sur Eviews : 


Ramsey RESET Test : 

F-statistic 0.049866  Probability 0.827792 
Test Equation : 

Dependent Variable : Y 


Included observations : 14 


Variable Coefficient | Std. Error | t-Statistic Prob. 

C 16.40322 42.74223 | 0.383771 0.7092 
X1 0.326961 1.759415 | 0.185835 0.8563 
X2 — 0.150146 | 0.809298 |- 0.185526 0.8565 
FITTEDA2 = ÿ? 0.015484 0.069342 | 0.223308 0.8278 


Remarque : La F-statistique est égale à F* — 0,0498 — (*)? = (0,223). 
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xercices récapitulatifs 


Exercice n° 9 


Estimation d’un modèle et tests de validité à partir de la connais- 
sance de quelques éléments statistiques 


Sur n — 100 observations et pour trois séries (y, x et x2 ), nous avons les résultats 
numériques suivants : 


V(y) = 1000; r° ,1 = 0,75; ri x2 = 0,45 ; 79 ,2 = 0,85; ÿ = 12 
1) Nous avons effectué la régression : ÿ = 10 x1 — 6. 


Le coefficient de x, est-il significativement différent de 0 ? 


2) La régression de y sur x, a donné Ÿ — 4 x, + 8, le coefficient de x, est-il significa- 
tivement différent de 0 ? 


3) Calculer les coefficients du modèle : y = ao + 41 x1 + d2 2 + 6, et le coefficient de 
corrélation multiple. 


4) Les coefficients a, et a sont-ils significativement différents de 0 ? La régression est- 
elle globalement significative ? 


Solution 


1) La variance estimée du coefficient de régression est donnée par : 
22 
22 


© 
O3 = = ——— 
â — 2 
D Gr — X1) 
t 
Nous savons que dans le cadre de la régression simple, il y a égalité entre corréla- 
tion simple et corrélation multiple, soit : 


2 
nés D = D)Gu — so) 
2 = , ee t 


TORTUE TES TEE 


=R =]1- = 0,75 
Do-57) 
Or : d 
Do» D o-5) 
= 1 000 = — = — 3)? = 100 
V(y) = 1 000 - 06 > 20 3)? = 100 000 


Nous utilisons ici la formule de la variance d’une population (division par n) et non 
la formule de la variance d’un échantillon (division par n — 1). 
D'où : 


De = (1 — 0,75) - 100 000 = 25 000 — &? = 25 000/(n — 2) = 255,1 
t 
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Pour calculer la variance de x; , nous utilisons les relations : 


DO: D Gu — 71) 
de Der = 10 
2) 
De = DGu — so) 
= Do-» Gr) 


Connaissant DC — y} — 100 000 , nous trouvons : 
Î 


et 


= 0,75 


r 


DGr 3) = 750 et D [Gr — Y)G — 71) = 7 500 
t Lt 


Soit : Var (x1) = 7,5 et Cov (y, x1) = 75 


e . 
6: 2 SL ae gpe 10 
0,58 


63 = = 
DT 3x) 750 
t 


22 


= 17,14 > 199 = 1,96 


Le coefficient de régression de y sur x, est significativement différent de 0. 


2) Un calcul analogue pour l’écart type du coefficient de régression de y sur x2 conduit 
aux résultats suivants : 


De? = (10,85) : 100 000 = 15000 — 67 = 15 000/98 = 153,06 
t 
D Gr —%)=53125 et DC — )(Xn — X2) = 21 250 
F t 


Soit : Var (x) = 53,12 et Cov (y, x2) = 212,50 


0,17 


6: = 23,5 > 10% = 1,96 


f DGu-m) 53125 
t 


Le coefficient de régression de y sur x2 est significativement différent de O. 


3) Calculer les coefficients du modèle : 
Y = do +aixi + dX2+E 


Nous avons la relation d’après les équations normales (cf. section II, p. 50) : 


El : pa so Pal 


& Cov(xi,x2)  Var(x) Cov(y, x2) 
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Nous connaissons tous les éléments de ce calcul sauf Cov(x1, x), or : 


2 
; Da — X1)(Xx — s) 
“= [Cov(x, 2) 1 = 0,45 
x1,x2 V(xi) l V() D Gu = x) D Gr = D) ; 


t 


Var(x:) = 7,5 et Var(x) = 53,12 — Cov(x:, x) — 13,389, en effet la covariance 
entre x, et x2 est positive puisque les covariances entre y et x1, et y et x2 sont positives. 


&1_[75 13391[ 75 |] _[ 0,242 -0,061][ 75 1 [5,19 
&] [1339 53:12] [2125]  [-0061 0,034][ 212,5] ” | 2,69 


Le terme constant est donné par &o = y — @1 X1 — @ X2. 


Or y = 12 ; & = 5,19 ; & = 2,69, de plus x1 = 1,8 car y = 10 x; — 6 (modèle 1) 
et X>—=1 car y —=4%x; +8 (modèle 2) — 4 — — 0,032. 


Le coefficient de détermination est égal, si l’on raisonne sur des données centrées, à : 


7 500 
192 
RES VE DO 2 GE || _ 960875 
TEL SG 5? 7 100000 
FA 


Car Ÿ'Ÿ =(Xa) (XD =& X'(X(X'X)!X'Y)=G X'Y 
Le coefficient de corrélation multiple est égal à R = 0,98 


4) Analyse des résultats et tests statistiques. 
* Significativité des coefficients 


Pour calculer les ratios de Student, il convient d’abord de connaître les écarts types 
de chacun des coefficients. 


La ” sf. Va 1 Var(x:) Cov(x1, x) E: 
2 RUX XVI EF x — 
Ds — De ( ) à pers Var(x) 
Or : 
(AR) D) Gr 3) 
2 SCR _(1— R?) SCT : > | __ (1 — 0,96) 100 000 
pk 1 n—k=1 n—k-—1 7 100—2-—1 
62 = 41,23 
0,242 5,19 
62, = 41,23 x — "© = 0,097 —+ Ga = 0,316 —> #° = 7 = 16,4 > DS =], 
CE ,23 x 100 0,097 — 631 = 0,316 — 0.316 6,4 > 96 


ne 0,034 _ 2,69 
62, = 41,23 x © = 0,014 —+ 632 = 0,118 —> rs = 
à 100 0,118 


= 22,8 > 1005 — 1,96 


Les coefficients a, et a, sont significativement différents de 0. Nous pouvons obser- 
ver des différences par rapport aux valeurs estimées précédemment, sur les coefficients 


et sur leurs écarts types. Cela est la conséquence de la colinéarité! entre x, et 
X(Fx1,x2 = 0,67). 
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+ Analyse de la régression dans son ensemble 
Nous calculons la statistique de Fisher : 


: R?/k __ 0,96/2 
7 (—R2)/(n—k—1)  (1—0,96)/97 


* 


= 1164 > F9 = 3,10 


La régression est globalement significative. 


Exercice n° 10 


Test d’une combinaison linéaire de coefficients de régression (test de 
contrainte linéaire) 


Pendant 23 ans nous avons relevé, sur une parcelle de terre située en Auvergne, les 
rendements de la culture de blé (y), la température moyenne (x.) et le niveau des pré- 
cipitations (x2). 

L’ajustement de ce modèle conduit aux résultats suivants : 


y —=0,510x, —0,350x: +27,3+e 


n —=23 
R? = 0,937 
0,0009  —0,08 —0,3 
(X' X)_! = | —-0,08 0,0025 0,02 
—0,3 0,02 0,2 
et SCT = DC — 5) = 317,46 
t 


On demande de tester les deux hypothèses suivantes : 
1) Existe-t-il une influence d’au moins un des facteurs ? 


2) Le coefficient de la température est-il significativement deux fois plus élevé que celui 
des précipitations ? 
Solution 


1) Nous procédons au test de Fisher : 


HO : a = a; =0 


1. Les différents aspects de la colinéarité sont étudiés au chapitre 4. 
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H1 : il existe au moins un des coefficients non nul 
_ R?/k e 0,937/2 
7 (—R2)/(n—k—1)  (1—0,937)/20 


Nous rejetons l’hypothèse a; = a = 0, il existe au moins un des coefficients non nul. 


* 


= 148,731 > F5 = 3,49 


2) Le test d’hypothèses est le suivant! : 
H0 : a —-2a =0 
H:a-2a%0 
Sous HO, le rapport ET, suit une loi de Student à n — k — 1 degrés de 
liberté. .. 
Il convient tout d’abord de calculer la variance de (4, — 2 &) : 


On rappelle que Var(a x + b y) = a? Var(x) + b? Var(y) + 2ab Cov(x,y) (a et b 
sont deux nombres réels ; x et y sont deux variables aléatoires). 


Va 58) = Var) Val 28) 12 Co, 089 
Var(@ — 2 &) = Var(&) + (—2)?Var (@) + 2 x —2 Cov(&, &) 


De plus, la variance résiduelle est donnée par : 


de = (1— R?): SCT = (1 — 0,937) : 317,46 — G? = 20/(n—3)=1 
4 


D'où 82): = 62 +462, — 4 Cov (&, &) 
623 42 = 0,0009 + 4 x 0,0025 — 4(—0,08) = 0,33 


@G—-2@)—0 _- (0,51 +2 x 0,35) 
Gai-2a2 _ 0,57 


= 2,10 > 190 = 2,08 


Nous rejetons (de justesse !), au seuil de 5 %, l’hypothèse HO. Cependant, pour un 
seuil de 4 , l'hypothèse HO est acceptée. 


Remarque : Nous pouvons aussi procéder à ce test en calculant la statistique 
G-2@\? _ PE n. 
—=—— qui suit un x” à 1 degré de liberté ; c’est ainsi que ce test de restriction 
Oâi 2 à 
linéaire sur les coefficients du modèle peut être généralisé à des restrictions non linéaires 
(test de Wald). Par analogie, prenons par exemple une contrainte du type 
sie & x & à 2 " : à 
di X a = 1, la statistique | — suit un x” à 1 degré de liberté. Cependant, la 
OGi xär 
variance de (4 x @) n’est plus directement calculable, elle est alors estimée par une 
approximation de Taylor. Sans procéder à deux estimations différentes, l’une sur le 
modèle non contraint et l’autre sur le modèle contraint (cf. exercice 3), le test de Wald 
permet, donc en une seule étape, de tester des restrictions sur les valeurs des coefficients. 
Les logiciels d’économétrie proposent directement ce test. 


1. Nous pouvons répondre à cette question par un test d’analyse de la variance (section IV). 
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Exercice n° 11 


Reconstitution d’informations manquantes 


Un économètre recherche une relation entre le taux de mortalité (TX), les dépenses 
de santé (DS), le pourcentage de plus de 60 ans dans la population (POP) et la densité de 
médecins (DM). 


Une estimation sur 10 pays effectuée à partir du logiciel RATS conduit aux résultats 
suivants (les données ont été préalablement centrées sur leur moyenne) : 


DEFIHMILNT YMGLASLIE Ë LE 
TOTAL OSSERVATIONS 19 SÉIPPENFMISS INC mi] 
USAËTE OBSERVATIONS 10 OESFELS OF LRLETHM FTTrS 
EY*2 TPTÉ FRAR#2Z .93/3919 
SSn LS Té2La SEE PTÉT 
KÜ. LABEL VAR LAG COEFFICIENT STAND. ERROR T-STATISTIC 
+ EX LELL TE. LEE LE 21 LS LLLLLLLLEELEL) LLLELLEREL LEZ) LELELESRLLELE: 

1 DS T 0  Trr? .1286119E-01  9.06a011 

2 FOF E D -, 1881785 FTP PTTT 

3 CM 9 [a] . 3185647 -112B1r7 2.825715 

0,0034229 
(X! X)-! = | —0,00074442  0,1031686 
—0,018265 —0,125482 779? 


1) On demande de calculer les valeurs manquantes notées par : ??7. 


2) Les coefficients des dépenses de santé et de la densité médicale sont-ils respective- 
ment et simultanément différents à 0,10 et 0,30 ? 


Solution 


1) Les résultats complets sont les suivants : 


DLFENDENT YARI4BIE Ë TX 
TOTAL DESERYATIONS 10 SÉIFFEU/MIES ING ü 
USARLE OBSERVATIONS 10 DECREES OF FREEDOM 7 
R*#2 . 848154 REARE #3 . JB FAATUL 
SR . 531 TA2EE SEE .21963641 
HO. LABEL Va LAC  CCEFFICIENT STAND. ERAOR  T-STATISTIC 
LES | ÉLELLELF: LES ate CELELETELLILEE CELRLEILALLE) LÉLETILLÉE ETES 

1 LS T 0 1836061 .1286118F-01 8.062011 

2 POP 8 0 -.1#81788 .1065356E-01 -2.667180 

3 DH 3 6 .3186637 . 1126177 2.828718 

0,0034229 
(X' X)7! = | —0,00074442  0,1031686 
—0,018265 —0,125482  0,26286 
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2) Le test d’hypothèses est le suivant : 


La relation [15] sous HO s’écrit : 


CE ae 


Nous avons qg =2, à, = Ci et ay = de La matrice des variances 


covariances des coefficients est égale à : 


0,0034229 
3 = 0,0482 | —0,00074442 0,1031686 
—0,018265 —0,125482  0,26286 


d’où : 


_ 0,0034229  —0,018265 
O3 = 0,0482 ( ) 


—0,018265 0,26286 


— 


3-1 [9632,962  669,3578 
4 7 | 669,3578 125,4386 


1 
= SCIE —0,1 0,318 —0,3)x 
. 9632,962  669,3578 0,103 — 0,1 
669,3578 125,4386 0,318 — 0,3 


= 0,172 est à comparer à F*(q, n — k — 1) = ES = = 4,74, le F* empirique 
est Us au F lu dans la table, on accepte . hypothèse HO. 


Les coefficients a, et a; sont simultanément et respectivement égaux à 0,1 et 0,3. 


Exercice n° 12 


Modèle à deux régimes : estimation par variable muette 
ou par analyse de la variance 


Nous reprenons l’exercice 6 du chapitre 2 concernant la relation liant la rémunéra- 
tion et la durée des études. Nous disposons d’un échantillon de 40 hommes et 25 femmes 
ayant le même âge dont nous connaissons la rémunération annuelle (y;) et le nombre 
d’année d’études (x;). 
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Pour étudier l'influence du genre sur la rémunération, nous avions comparé les coef- 
ficients de régression. 


1) Quel type de variable peut-on introduire pour étudier cet effet ? 
2) Nous avons procédé à trois estimations : 

sur l’échantillon global et nous obtenons : SCR ; 

sur l’échantillon des 40 hommes : SCR; ; 

sur l’échantillon des 25 femmes : SCR. 


Comment construire le test d’homogénéité ? 


Solution 


1) Une variable muette prenant la valeur 1 pour les hommes et 0 pour les femmes permet 
d’estimer l’effet du genre sur la rémunération. Si le coefficient de cette variable indi- 
catrice est significativement différent de O, alors le genre est un facteur discriminant. 


2) I s’agit d’une application du test de Chow à un modèle en coupe instantanée (test 
d’homogénéité de comportement). 


Le Fisher empirique est égal à : 


* 


_ [SCR — (SCR; + SCR;)]/ddl, 
. (SC Ra + SCRy)/ddia 


avec ddl, =(n—-k—1)-[(n, —-k—-1)+(n —-k-—-1)]=2 
ddl = (in —-k-1)+(n-k-1)=n—-2(k+1)=65-4—61 
Si F* < F9% — 3,15, l'hypothèse HO est acceptée, les coefficients sont stables sur 
l’ensemble de l’échantillon ; dans le cas contraire, il existe une différence significative 


entre la rémunération des hommes et des femmes (c’est le cas ici, cf. les résultats de 
l’exercice 6, chapitre 2). 


Nous avons donc développé trois méthodes différentes d’analyse pour répondre à la 
même question. 


Exercice n° 13 


LL, fichier C3EX13 


Estimation d’une fonction de production : impact de la privati- 
sation 

Soit une fonction de production de type Cobb-Douglas : 

Log Q = Log a + Log K + aLog L+e, 

Q = production 


K = facteur capital 
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L = facteur travail 
6, = terme d’erreur répondant aux hypothèses classiques. 


Nous disposons de données concernant 50 entreprises du secteur des télécommuni- 
cations en Europe pour une année donnée. Le tableau 9 présente un extrait des données. 


Tableau 9 — Extrait des données de production, facteur travail, facteur capital 
et variable indicatrice 


Entreprise Q K L DUM 
5192511 11 523 4 610 1 
2 8 717 373 22 476,2 6 948 1 
49 3 701 601 10 147,4 4760 
50 440 380 835 248 0 


1) Écrire le modèle sous sa forme originale, c’est-à-dire non linéaire. Comment s’inter- 
prètent les coefficients a; et a de ce modèle ? 


2) On désire mesurer l’homogénéité des comportements entre les entreprises publiques 
et les entreprises privées, pour ce faire nous intégrons une variable muette (nommée 
DUM) qui prend les valeurs 0 pour les entreprises publiques et 1 pour les entreprises pri- 
vées. 


Soit à estimer le modèle suivant : 
Log Q = Log & + a,Log K + a,Log L + bDUM + b DUM *x Log K 
+ b,DUM x Log L+e 
Existe-t-il une différence des fonctions de production entre les entreprises publiques 
et privées ? Si oui, pouvez-vous la quantifier ? 


3) Proposer et expliciter une autre méthode afin de tester l’homogénéité des comporte- 
ments des entreprises. 


4) Nous proposons maintenant d’estimer une fonction de production de type 
« Translog » en négligeant les spécificités « public/privé » : 


Log Q = Log & + a.Log K + a;Log L + a; x 0,5 x (Log KYÿ 
+ as x 0,5 x (Log L)? + asLog L x Log K +e 


La spécification Translog vous semble-t-elle mieux adaptée que la spécification 
Cobb-Douglas ? Vous justifierez votre réponse par un test approprié. 


Solution 


1) le modèle sous sa forme initiale s’écrit : Q = aoK°!L®?ef 
Les coefficients s’interprètent comme étant des élasticités : 
di = élasticité de la production au facteur capital 


a) = élasticité de la production au facteur travail 
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Il s’agit d’un modèle linéaire sur ses coefficients, c’est-à-dire non linéaire sous sa 
forme initiale mais linéarisable par une simple transformation logarithmique, le modèle 
est Log-linéaire. 


2) Les résultats d’estimation sont les suivants : 


Dependent Variable : LOG(Q) 


Included observations : 50 


Variable Coefficient | Std. Error t-Statistic Prob. 

C 6.477194 0.287830 22.50358 0.0000 
LOG(L) 0.230860 0.143231 1.611803 0.1142 
LOG(K) 0.747993 0.143545 5.210878 0.0000 
DUM — 1.018567 | 0.457088 | -2.228384| 0.0310 
DUM*LOG(L) 0.212946 0.241356 0.882290 0.3824 
DUM*LOG(K) — 0.091142 | 0.225917 |—-0.403431 | 0.6886 


Les variables LOG(L), DUM*LOG(L) et DUM*LOG(K) ne sont pas significatives 
(probabilités critiques supérieures à 5 %) nous commençons par retirer du modèle la 
moins significative DUM*LOG(K). La nouvelle estimation est la suivante. 


Dependent Variable : LOG(Q) 


Included observations : 50 


Variable Coefficient | Std. Error t-Statistic Prob. 

C 6.517159 0.267719 24.34327 0.0000 
LOG(L) 0.266781 0.111144 2.400321 0.0206 
LOG(K) 0.711198 0.109808 6.476720 0.0000 
DUM — 1.072324 | 0.433148 | -2.475654]| 0.0171 
DUM*LOG(L) 0.118229 0.055440 2.132570 0.0385 


Les variables sont maintenant toutes significatives, nous constatons que les variables 
indicatrices DUM sont explicatives : il existe donc une différence significative entre les 
fonctions de production des entreprises publiques et privées. 


Pour les entreprises publiques, la fonction de production s’écrit (DUM = 0) : 
Log Q = 6,52 + 0,266 Log L + 0,711 Log K +e 


Pour les entreprises privées, la fonction de production s’écrit (DUM = 1) : 


Log Q = 6,52 + 0,266 Log L + 0,711 Log K-1,07DUM 
+0,11DUM x Log L+e 


Log Q = 5,44 + 0,384 Log L + 0,711 Log K +e 


Nous remarquons que le facteur travail contribue plus à la production pour les entre- 
prises du secteur privé que pour les entreprises du secteur public. 
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3) Nous pouvons procéder au test de Chow en segmentant notre échantillon entre les 
entreprises du secteur privé et les entreprises du secteur public. 


(SCR = (SC R°'É + SCRPibliaue)) /(k + 1) 


(SC RP'ivé + SC RPublique) /(n "=" 2(k + 1)) 
qui suit alors une loi de Fisher à (k + 1) et n —2 x (k + 1) degrés de liberté. 


Soit à calculer la statistique : F* — 


SCR = somme des carrés des résidus calculée sur la totalité de l’échantillon 
des 50 entreprises. 


SCRPYÉ — somme des carrés des résidus calculée sur les 21 entreprises privées. 


SCRPtbliae — somme des carrés des résidus calculée sur les 29 entreprises 


publiques. 
k=2etn = 50. 
1,853 — (0,795 + 0,629))/3 . 
Soit F* — ( ( »/ & 4,42 > te Æ 2,84. Nous rejetons 


(0,795 + 0,629)/44 
l'hypothèse HO, le modèle est instable, il existe une différence significative entre les 
fonctions de production des entreprises publiques et des entreprises privées. 


4) Les résultats d’estimation de la fonction « Tranlog » sont les suivants : 


Dependent Variable : LOG(Q) 


Included observations : 50 


Variable Coefficient | Std. Error t-Statistic Prob. 

C 5.404574 1.957160 2.761437 0.0084 
LOG(K) 1.686188 1.201063 1.403913 0.1674 
LOG(L) — 0.612883 | 1.071805 |-0.571823| 0.5704 
0.5*LOG(K)"2 0.031900 0.939072 0.033970 0.9731 
0.5*LOG(L)"2 0.289379 1.031212 0.280620 0.7803 
LOG(L)*LOG(K) — 0.156205 | 0.978803 | -0.159588 | 0.8739 


La fonction Translog se ramène à une fonction Cobb-Douglas si a3 = 44 = as = 0, 
soit à tester l'hypothèse HO : a3 = a4 = as = 0. Si nous rejetons l’hypothèse HO (au 
moins un coefficient non nul), cela signifie que la spécification Translog est mieux adap- 
tée que la spécification Cobb-Douglas. Il s’agit d’un test de Fisher de contrainte (test de 
Wald) d’un sous-ensemble de coefficients, le résultat est le suivant : 


Wald Test : 

Equation : TRANSLOG 

Test Statistic | Value | df | Probability 
F-statistic 10401096 | (344 | 0:7529 


La probabilité critique du test est de 75 %, nous acceptons donc l’hypothèse HO, la 
spécification Translog n’est donc pas mieux adaptée que la spécification Cobb-Douglas. 
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Exercice n° 14 


Fonction économétrique d’investissement 


Une estimation économétrique de la part des emprunts dans les investissements 
d’une importante entreprise pétrolière donne : 


EMP INVO 
——— = —0,6645 x TIR + 179,07 x 
INV INVI 


(1,26) (4,69) 


R? = 0,65 ; n = 17 (nombre d’années de la période d’estimation) 


+36,31+e 


Les chiffres entre parenthèses sous les coefficients sont les de Student avec : 


EMP = emprunts totaux 

INV = investissements totaux 

TIR = taux d’intérêt réel 

INVO = investissements de la société dans les forages offshore 
INVI = investissements industriels 

e = résidu d’estimation 


1) Commentez les résultats obtenus, les coefficients des variables explicatives ont-ils le 
signe attendu ? 


2) Quel est l’effet d’un passage de 13 % à 15 % de INVO/INVI sur la variable endogè- 
ne ? 


3) Le coefficient de la variable TIR n’est pas significativement différent de zéro. Quelle 
explication économique peut-on donner à ce résultat ? 


4) On estime de nouveau ce modèle en retirant la variable TIR, les résultats sont les sui- 
vants : 


PE ee io 
ENV RC INUI UT 
R? = 0,57 


Pourquoi a-t-on retiré la variable explicative TIR (donnez deux raisons possibles de 
la non-significativité statistique de cette variable) ? 


Le coefficient de détermination a diminué, est ce fortuit ? 


Les coefficients du modèle sont légèrement différents de la première estimation, 
pourquoi ? 


5) L’estimation économétrique de l’équation de la question 4 permet-elle de donner une 
approximation du taux d’autofinancement de cette entreprise ? Donner le cas échéant 
une valeur lorsque INVO/INVI = 13%. 
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Solution 


1) Le taux d'emprunt dépend : 


+ négativement du taux d'intérêt, ce qui est conforme à l’intuition économique ; mais 
le coefficient de cette variable n’est pas significativement différent de 0 
(é* = 1,26 < 1% = 2,14) ; 


* positivement de l’investissement dans les forages offshore, ce qui est logique car 
l'investissement dans les forages « offshore » est très important ; le coefficient est signi- 
ficativement différent de 0 (1* = 4,69 > is = 2,14). 


2) Par application du modèle estimé, il vient : 


EMP 
A=——— = 179,07 x (0,15 — 0,13) = 3,58 
INV 


3) La compagnie pétrolière doit pratiquer l’autofinancement, donc il n’existe pas de sen- 
sibilité au taux d'intérêt. 


4) La variable explicative TIR n’est pas significative car elle n’est peut être pas assez 
corrélée avec la variable à expliquer ou bien colinéaire avec l’autre variable explicative. 


Le coefficient de détermination a diminué car le fait de retirer une variable explica- 
tive même non significative fait augmenter mécaniquement la Somme des Carrés des 
Résidus. 


Les coefficients du modèle sont légèrement différents car la colinéarité entre les 
variables explicatives entraine une modification de la valeur estimée des coefficients. 


5) Par application du modèle estimé il vient : 


EME 6 15 x 0,13 + 41,28 = 62,35 
INV — > D XU, ,28 — 02, 


= Autofinancement = 100 — 62,35 = 37,65 % 


Annexe 


nterprétation géométrique de la méthode 
des moindres carrés 


Soit les vecteurs Y, X1, X2,..., X, composés de n éléments que nous pouvons donc 
représenter dans R”. 


Nous cherchons à minimiser : 


Min Ÿ_e? = Mine’ = Min (Y — Xa) (Y — Xa)=MinS 


t=1 
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Avec X — (X1, Koss X%). 


Le vecteur Xa = (X1, X2,..., Xx) | 42 | appartient au sous-espace vectoriel 


(L) de R" engendré par X1, X2,..., X4. 


La quantité S est minimale lorsque le vecteur e = Y — Xa est orthogonal au sous- 
espace (L). 


Le graphique 7 illustre ce propos. 


Graphique 7 — Interprétation géométrique de la régression multiple 


ésolution de l'exercice 1 par des logiciels 
informatiques de régression multiple 


+ Logiciel RATS 
Dépeudéent Variable Ÿ - Estimation by Least Squares 
Usaable Obacrvations ii Legrees of Freedom 10 
Centered KE*#3 0 _792647 FE Eax **i D,6123433 
Inçgenterca RYY2 2.985401 T zx Rés? 135.756 
Mean ef Dependent Variables 17.7142B85%14 
ta Error of Dependent Variable 4d.177S385480 
Standard Error Cf Estimate 2,597068648 
Sum a Squared Residuals 67. AÎTé4B0SL 
Fegression F{2,10) 7.858782 
Siqgnificance Level of F O.00545230 
Durbin-Watson Sratiatic 5.186886 
Variabie Cam &td Error T-état Sigqnif 
CRT LILITIITTA TT LT LI LSEITITETITITILSITISIISILLITISTITITETITIIITT2. 
l. Constant 68158488 11.66331012 £.8i0068 0.018918860 
2, 1 C.E0I1S006S 0298432594 2-607012 0.922#1643 
3, 2 —0.58136236 ©.156E0068 -2.414866d4 2.036511440 
4. 7 —0.0371352344 0.05202312 -0,713764 0,49189368 
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Nous retrouvons bien l’ensemble des résultats de l’exercice 1. 


+ Logiciel Eviews 


Sample : 
included chservations: 


1 14 
i4 


7.714123 
.177385 
-143723 
.326311 
.-974181 


Variable Caefficient Std. ErrorT-$tatistic 

Les 32.89132 11.66337 2.820068 

1 0.901301 0.298436 2.687012 

X2 -0.381362 0.156581 -2.435564 

23 -0.037132 9.052023 -0.713768 
B-squared 9.702687 Mean dependent var 1 
Adjusted FR-squared 0.613493 &.D. dependent var 4 
S.E, of regression 2.597969 Akaike infs criter 2 
Sum squared resid 67.44767 Séhwartz critorion 2 
Log likelihocd 34.987120 F-statistie 7 
Durbin-Wateon stat 3.186886 Ü 


. 005452 


+ Tableur EXCEL 


104 € 


— par la fonction DROITEREG 


—0.03713 —0.38136 0.801901 32.89132 
0.052023 0.156581 0.298436 11.66331 
0.702687 2.597069  #N/A #N/A 
7.878181 10  #N/A #N/A 
159.4095  67.44767  #N/A #N/A 


Interprétation et correspondance des informations issues du tableau EXCEL 


ä @ 
Gas CA 
R? Ge 
fe dal 
SCE  SCR 


à en 
CA CA 
#N/A #N/A 
#N/A #N/A 
#N/A #N/A 


Par l’utilitaire d’analyse « Régression Linéaire » (Macro-complémentaire) 


RAPPORT DÉTAILLÉ 


Statistiques de la régression 


Erreur-type 
Observations 


ÉCONOMÉTRIE 


Coefficient de détermination multiple 
Coefficient de détermination R12 
Coefficient de détermination R'2 (ajusté) 


0,838 
0,702 
0,613 
2,597 

14 


ANALYSE DE VARIANCE 


Degré Somme Moyenne F 
de liberté des carrés des carrés 
Régression 3 159,409 53,1368 7,8786 
Résidus 10 67,447 6,74476 
Total 13 226,857 
Coefficients Erreur-type Statistique Probabilité 
Constante 32,891 11,663 2,820 0,0181 
XI 0,80190 0,298 2,687 0,0228 
X2 —0,3813 0,156 —2,435 0,0351 
X3 —0,0371 0,05202 —0,713 0,4916 


stimation de la variance de l'erreur 


La variance de l’erreur est inconnue, nous allons donc l’estimer à partir de la somme des 
carrés des résidus. 


Soit : e = Y-Xà = Y — X(X'X)-!X'Y = PY avec P = 1— X(X'X)-!X. 


Cette matrice P est symétrique et idempotente (P? — P). Elle est aussi telle que 
PX=0etPe=e. 


e= PY = P(Xa+e) = Pe puisque PX = 0. 


D'où l’espérance de l’erreur est donnée par : E(e'e) = E(e’ P'Pe) = E(e'Pe) car 
(P?= P). 


En utilisant le fait que la trace! d’un scalaire est un scalaire, il vient : 
E(e'Pe) = ElTrace(s'Pe)] = E[Trace(ee’P)] 
= o?Trace(P) = o?Trace(I-X(XX) !X') 
= o?Trace(1)-0?Trace[X(X'X)-!X'] 
= o?Trace(1)-0?Trace[(X’X)-!(X'X)] = o2(n-(k + 1)) = o?(n-k-1) . 
Trace(1) =n et Trace[(X'X)-!'(X'X)]—=k+1 car (X'X) est de dimension 
&+1,k+ 1). 


D'où l’estimateur de la variance de l’erreur (appelée aussi la variance résiduelle) 
s’écrit donc : 
2 
e 
2.« 
t 


FT tetod heal 


1. La trace d’une matrice est égale à la somme des valeurs de la première diagonale. 
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ulticolinéarité 
et sélection 
du modèle optimal 


ans ce chapitre, nous examinons comment gérer l'abondance de 
l'information. En effet, il est fréquent, lorsque l'économiste spé- 
cifie un modèle, qu'il hésite à intégrer telle ou telle variable 
explicative. La question essentielle qu'il se pose est la suivante : comment 
déterminer le mix optimal des variables explicatives ? Formulée en terme 
statistique, cette question se résume à trouver les variables explicatives 
qui maximisent leur coefficient de corrélation avec la série à expliquer, 
tout en étant les moins corrélées entre elles. 
Nous présentons, en |. tout d'abord la notion de corrélation partielle qui 
permet de déterminer l'apport relatif de chaque série explicative à l'ex- 
plication de la série endogène. 
Les relations entre les coefficients de corrélation simple, partielle et mul- 
tiple sont examinées en II. 
Les conséquences de la multicolinéarité sur l'estimation des coefficients 
de régression font l'objet du III. 
Enfin, les techniques de sélection de variables explicatives sont exposées 
et illustrées à partir d'exemples en IV. 


orrélation partielle 


xemple introductif 


Un marchand de glaces, situé près de la tour Eiffel, cherche à calculer le coeffi- 
cient de corrélation entre ses ventes (x) et le nombre de touristes visitant ce 
monument (x). Ces deux variables sont influencées par le climat : la consom- 
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mation de glaces est plus importante lorsqu’il fait chaud et les touristes sont peu 
enclins à visiter un monument extérieur en cas de froid ou de pluie, on appelle 
x; cette variable climatique. 


Nous pouvons penser que la corrélation entre x; et x, est positive, cependant 
un calcul de coefficient de corrélation simple n’est pas révélateur du degré de liai- 
son réelle entre ces deux variables ; en effet, la variable climat influence la vente 
des glaces et la fréquentation des touristes. En d’autres termes, le coefficient de 
corrélation simple calculé ainsi intègre l’apport de la variabilité des conditions 
climatiques sans pouvoir isoler l'influence relative du nombre de touristes. 


énéralisation de la notion de corrélation partielle 


Le coefficient de corrélation partielle mesure la liaison entre deux variables 
lorsque l'influence d’une ou des autres variables explicatives est retirée. 


Soit y une variable à expliquer, et x;, x, et x; des variables explicatives : 


5 . : : : _— 
Fous ls uw €trS 3 mesurent respectivement la variance de y expliquée par 


la variable x, seule, x, seule et x; seule. 


Nous pouvons calculer six coefficients de corrélation partielle du premier 


ordre : 


2 . 2 . 2 


2 D: 2 
yxl.x2 ? r r 


yxlx3 ? Fx2xt ; Fx2.x3 ; Fx3xt ; yx3.x2 ; 
ainsi que trois coefficients de corrélation partielle du deuxième ordre : 


2 


. 2 
yxl.x2 x3 ? r 


2 
r yx3.xl x2° 


r yx2.xl x3 ? 


Cette notion de corrélation partielle est très importante car elle permet de 
juger de la pertinence d’inclure une variable explicative dans un modèle. 


Plus le coefficient de corrélation partielle d’une variable est élevé, plus la 
contribution de cette variable est importante à l'explication globale du modèle. 


Le coefficient de corrélation partielle peut se calculer de deux manières à 
partir : 


1) Du coefficient de corrélation simple 


— Entre le résidu de la régression de la variable à expliquer sur le sous- 
ensemble des k — 1 autres variables explicatives, 

— et le résidu de la régression de la variable explicative x; sur les k —1 
variables explicatives. 


Exemple de calcul de r°,3,1 
Étape 1 : calcul de résidu e; de la régression de y sur x; et x 


ei = } — (Go + & Xi + @ x) 
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Etape 2 : calcul de résidu e, de la régression de x3 sur x; et x 
€ = X3 — (a'o + 4'i Xi + Q'2 X) 
Etape 3 : calcul du coefficient de corrélation simple entre e, ete; 


2 2 
Vyx3.x1 X2— l'e1,e2 


2) Du t de Student 


Dans un modèle à k variables explicatives, il existe une relation entre le coeffi- 
cient de corrélation partielle et le de Student! : 


1? 
2 = 
F\xi (autres variables) Fe ee (n — k =. 1) [1] 


Attention : cette relation n’est vérifiée que pour un coefficient de corrélation 
partielle d’ordre k — 1. 


Exercice n° 1 


LL, fichier C4EX1 


Calcul des coefficients de corrélation partielle du premier ordre et 
du deuxième ordre 


Une entreprise cherche à déterminer quelles sont les influences respectives de la 
publicité (x1), de la promotion auprès des distributeurs (x), et de la promotion auprès 
des consommateurs (x;) exprimées en milliers d’euros sur les ventes en tonnes (y). 


Pour ce faire, elle dispose, sur 10 ans, des séries statistiques du tableau 1. 


Tableau 1 — Ventes, publicité et promotions 


Année y X] X2 X3 
1 49,0 35,0 53,0 200,0 
2 40,0 35,0 53,0 212,0 
3 41,0 38,0 50,0 211,0 
4 46,0 40,0 64,0 212,0 
5 52,0 40,0 70,0 203,0 
6 59,0 42,0 68,0 194,0 
7 53,0 44,0 59,0 194,0 
8 61,0 46,0 73,0 188,0 
9 55,0 50,0 59,0 196,0 
10 64,0 50,0 71,0 190,0 


1. Greene W.H., pages 234-235, 2000. 
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Pour répondre à cette question, on demande de calculer les coefficients de corréla- 
tion partielle du premier ordre et du deuxième ordre et de commenter les résultats obte- 
nus. 


Solution 


. à A 7 2 
Nous traitons complètement le calcul de r,,,,2 et ris 1 ,2 + les résultats des autres 


coefficients sont fournis afin que le lecteur puisse vérifier ses propres calculs. 


a) Calcul de r°,,,2 par corrélation entre les résidus 


Étape 1 : régression de y sur x2 


CEPEMDENT VARIABLE y 


R#*2 . S4ÉSAIES 
HO. LABEL VAR LAG COEFFICIENT STAND. ERAUX LSTATISTIL 
ÉTT ÉTETT TL CT TL] CFETELTLTS11: Re ÉMÉREMEREEE 
1 CCHETANT Q Q +, HERBE 13.756204 .- 2808141 
ä Xe 3 La) . TBQU5Ed . 804140 3. He r9Ei 


Résidu e; = y — (0,7809 x2 + 3,5809) 


Étape 2 : régression de x, sur x2 


DEPLHOENT VARIABLE %x1 


#+2 . 3662434 
NO. LABEL VAR Lac COEFFICTENT STAND, EFRECR T-STATISTIC 
#h* PTEFTTE KE sus LEE LE EIS LES) CPPFPTETTT LS. RÉSEENÉERE EN 
Î CONSTANT G [4 18.389095 51-7658û 1.562568 
£ xe 3 (el . 3809624 MÉSUEANIE A. O2SRER 


Résidu e = x, — (0,3809 x; + 18,3809) 


Étape 3 : calcul du coefficient de corrélation entre e, et e> 


€i e2 
1 4,02857 —3,57143 
2 —4,97143 —3,57143 
3 —1,62857 0,57142 
4 —7,56190 —2,76190 
5 —6,24762 —5,04762 
6 2,31429 —2,28571 
7 3,34286 3,14286 
8 0,40952 —0,19047 
9 5,34286 9,14286 
10 4,97143 4,57143 


re1e2 = 0,6798 — Fr, = 72,» = 0,4621 


yxl.x el,e 


La corrélation entre les ventes et la publicité est donc égale à 0,46, lorsque l’in- 
fluence de la promotion auprès des distributeurs est retirée. 


b) Calcul de r°,3,1 ,2 Par corrélation entre les résidus 


Étape 1 : régression de y sur x1 et x2 
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DEPENDENT YARIARE 7 


Rtt2 . 81005118 
HO. LABEL WAR LAS  COFFFICIFNT STAND. FRROR  T-SIATISTIC 
tr LERFLLL LEE CEE] CALLEEESTS LE): MAR ERESRER FARTÉSESIENN ER 
1 CONSTANT OO à -N.862133 LL. 42177 -, 8722008 
E] 1 2 O0  .7368000 . 3004381 2.452110 
3 x2 3 Q  .En02667 . 1866.36 2.549610 


Résidu e; = y — (0,7368 x1 + 0,50 x2 — 9,9621) 


Étape 2 : régression de x3 sur x1 et x2 


DEÉPÉNDTENT VARIANLI #4 


HN#S - 54412000 
DURE LAEEL VAR LAG COEFFICIENT STAND, ERRIR T-STATISTIC 
ait LEFT TE ÉLERTE LÉSPFETST EST PÉLLETETCETE CELEESTTE ELLE 
1 CONSTANT © © 268,832 18.876900 13.712253 
à X1 2 0 =, 4522000 . ASE 1SÈ 1. 417961 
3 XE 3 0 -.3541090 . 3250459 -, 8362024 


Résidu e; = x3 — (0,952 x; — 0,304 x; + 258,932) 


Étape 3 : calcul du coefficient de corrélation entre e; et e> 


ei e2 

Il 6,66000 —9,4000 
2 —2,34000 2,6000 
3 —2,04960 3,5440 
Ê —5,52693 10,7040 
5 —2,52853 3,5280 
6 3,99840 —4,1760 
7 1,02720 —5,0080 
8 0,54986 —4,8480 
9 —1,39360 2,7040 
10 1,60320 0,3520 


re = —0,921 — ru x = lé = 0,848 


La corrélation entre les ventes et la promotion « consommateur » est donc égale à 
0,84, lorsque les influences de la publicité et de la promotion « distributeur » sont reti- 
rées. 


c) Calcul de Ps w à partir du f Student 


Étape 1 : régression de y sur x1, x et x3 


JÉPENDENT VARTAULE 1 y 
R'#3 9114009 
KO], TAB. MAR LAC COEFFICIENT SIAKU. FREDR T-STATISTIC 
PES CETFETL LE LI ++ HASIHHÉHHESSE AFsLssassadé LÉLLLELLESESLEL) 
1 CONSTANT 0 ( 154, £905 PH. SGÛE 5, 249252 
2 x1 ë . BGEPSUE . 1550786 1.321425 
à XE 4 q - AGE T À «Sr to302E-UI 8, 770140 
z Ka? f Ù  - 5573204 .S6e0SBIE-01  -5.799119 
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Étape 2 : calcul du coefficient de corrélation partielle 


D’après [1], nous avons : 


: Ê SELS 0,848 
125 : 4 — = À 
TR PL (mn k—1) 5,79 + (10 — 4) 
d) Autres résultats 
Ps = 0,461 T3 = 0,212 sa = 0,480 
Po = 0,698 ras = 0,734 ras = 0,895 
Fies x3 — 0,225 Pas x3 — 0,703 Fast x2 — 0,848 


À la lecture de ces chiffres, l’apport intrinsèque de la variable promotion « consom- 
mateur» semble le plus important pour expliquer les ventes: r2,3,, — 0,734 ; 


ras = 0,895 et Re 1.2 = 0,848 sont les trois coefficients de corrélation partielle 


les plus élevés. 


elation entre coefficients de corrélation 
simple, partielle et multiple 


Dans le cas d’un modèle à une seule variable explicative x,, la somme des car- 
rés des résidus est égale à : 


SCR= = (Rx) = DO) (ri) 
t t 1 


R°,, = coefficient de détermination de la régression de y sur x. 


Supposons maintenant un modèle à deux variables explicatives : 


y.xl 


Y=d+dixX +ax+e 


La somme des carrés des résidus, après avoir retiré l’influence de x; et x;, est 


égale à : 
2 2 2 
SCR = > he >, GES R\,.x1x2) 
t t 
R\ 1 2 — Coefficient de détermination de la régression de y sur x, et x2. 
Or r°,,,, est la proportion du résidu expliquée par la variable x, seule, cette 


dernière expression peut donc s’écrire : 


DGA Ri) = (ru) DO) Ari) [2] 


D'où 1 — R° (1 — FD = 11) [3] 


y.xl x2 — 
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Nous avons ainsi la décomposition de l’influence relative de chacune des 
variables : l’apport de x, sur y lorsque l’influence de x; est retirée et l’apport de 
x, Sur y (certains auteurs emploient le terme de rendement pour qualifier ces 
apports relatifs). 


Cette formule [3] peut être généralisée pour un modèle à trois variables 
explicatives : 
F= Rs 22 x3 = (1 “. ra) — rom) — Fi 2) [4] 


Pour un modèle à quatre variables explicatives, nous obtenons : 
2 2 
L= R;, .x1 x2 x3 x4 = (1 2e en CIE ee He hi x2 13) 


Il est à noter que les indices peuvent permuter, ainsi, dans l’ordre, 3, 4, 1,2 ; 
la relation précédente devient : 


L= Ro x2 x3 x4 = (1 En FC ee) Us Fe x3 AE Fo x3 . 


Exercice n° 2 


Relation entre coefficients de corrélation simple, partielle et multiple 


Un économètre estime un modèle à trois variables explicatives : 


ÿ = 348,4 + 56,3 x; — 9,5 x2 + 234,8 x; 
(4,5) (8,3) (2,1) (4,6) 
R° = 0,76 
n = 65 
(.) = t de Student 


Le coefficient de corrélation linéaire entre y et x, est connu, F 1 = 0,52. 


On demande de calculer le coefficient de corrélation partielle r?,3,1 - 
Solution 

2 2 
A 4,6 


L fficient r? t égal à : = 
e coefficient r,311 ,2 est égal à B+Fu-k- D 46+(65-4 


2 
Fyx3xl x 


2 = 0,257 
Nous pouvons alors utiliser la relation suivante : 


1=— Ra x2x3 — (el ee Fa) = 1) nos x1 12) 
1—0,76= (1—0,52)(1—r2,, ,,)(1 — 0,257) 


yx2, x 


d'où r?,,1 = 0,324 


yx2.x 
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ulticolinéarité : 
conséquences et détection 


Le terme de multicolinéarité est employé dans le cas d’un modèle incorporant 
des séries explicatives qui sont liées entre elles. 


À l'opposé, pour des séries explicatives de covariance nulle (Cov (x, x) = 0), 
nous dirons qu’elles sont orthogonales. Si, pour des études théoriques, nous 
pouvons supposer que deux séries statistiques sont orthogonales, dans la pra- 
tique, lorsque l’économiste modélise des phénomènes économiques, les séries 
explicatives sont toujours plus ou moins liées entre elles. Nous allons donc exa- 
miner les conséquences de la multicolinéarité. 


onséquences de la multicolinéarité 


Nous pouvons citer trois effets principaux : 


a) augmentation de la variance estimée de certains coefficients lorsque la 
colinéarité entre les variables explicatives augmente (le de Student dimi- 
nue) ; 

b) instabilité des estimations des coefficients des moindres carrés, des faibles 
fluctuations concernant les données entraînent des fortes variations des 
valeurs estimées des coefficients ; 


c) en cas de multicolinéarité parfaite, la matrice X’X est singulière (le déter- 
minant est nul), l'estimation des coefficients est alors impossible et leur 
variance est infinie. 


Exercice n° 3 


Conséquences de la multicolinéarité 


Soit un modèle à deux variables explicatives dont les matrices X’X et X’Y sont 
calculées à partir d’un échantillon d’observations de variables centrées. 


’ 200 150 s.. . F350 
ele | tre 
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La suppression d’une observation modifie les résultats de la manière suivante : 


199 149 or AF3475 
rx=[ “4 rfi 


On demande : 

1) de calculer les coefficients de régression du modèle dans les deux cas ; 
2) puis de calculer le coefficient de corrélation entre x, et x2 ; 

3) de commenter les résultats. 


Solution 


1) Calcul des coefficients de régression 


a) Estimation des coefficients à partir des données de base. Les équations normales 


s’écrivent : … ” _ 
200 à; + 150 a; = 350 & = 1 
= 
150 & + 113 & = 263 G=l 


b) Estimation des coefficients après suppression d’une observation. Les équations 
normales s’écrivent : 


199 & + 149 & = 347,5 Res 
= 
149 & + 112 & = 261,5 D =3 


2) Calcul du coefficient de corrélation 


2 _  ICov (m, x) 


= RE V 00S un = 0,995 = 0,997 
#2 Var (1) x Var (0) TR 


3) Commentaires : une faible modification d’une des observations ou du nombre d’ob- 
servations entraîne une profonde modification des valeurs estimées des coefficients, 
cela est la conséquence directe de la très forte colinéarité entre x, et x2 (0,997). 


Afin d’éviter ce problème, il convient alors de détecter une éventuelle multicolinéa- 
rité lors de l’estimation d’un modèle. 


ests de détection d'une multicolinéarité 


1) Test de Klein! 


Le test de Klein est fondé sur la comparaison du coefficient de détermination R° 


calculé sur le modèle à & variables : 


Y=d+däx +x+...+ax+e 


1. Klein L.R., page 101, 1962. 
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et les coefficients de corrélation simple r, ,; entre les variables explicatives 
pour i £ j. 


Si R? < r° 


xi, xj? 


il y a présomption de multicolinéarité. 
Il ne s’agit pas d’un test statistique au sens test d’hypothèses mais simple- 
ment d’un critère de présomption de multicolinéarité. 


2) Test de Farrar et Glauber! 


La première étape consiste à calculer le déterminant de la matrice des coeffi- 
cients de corrélation entre les variables explicatives. 


1 F1 x2 Fx1 x3 secs Fri xk 
D = Fx2 x1 1 F2 x3 …. F2 xk 
Fxk x1 Fxk x2 Vxk x3 LiGE 1 


Lorsque la valeur du déterminant D tend vers zéro, le risque de multicoli- 
néarité est important. 


Par exemple, pour un modèle à deux variables explicatives, si les deux séries 
sont parfaitement corrélées, le déterminant D s’écrit : 


… 1 Fix | 1 1 …: 
= F,2 x1 1 _ 1 1 = 


Dans le cas opposé où les séries explicatives sont orthogonales, le détermi- 


nant devient : , 1,5 
— F1 x2 A _ 
Lu où F:2 x1 1 = 0 1 a l 


La deuxième étape consiste à effectuer un test du x°, en posant les hypo- 
thèses suivantes : 
H0:D=TI1 (les séries sont orthogonales) ; 


H1:D<1 (les séries sont dépendantes). 


La valeur empirique du “x? calculée à partir de l’échantillon est égale à : 
1 
#=-[n-i-5ex+5].1D 
où n est la taille de l’échantillon, K le nombre de variables explicatives (terme 
constant inclus, K = k + 1) et Ln le logarithme népérien. 
cu DS 2 1 ' _——. : . 
Si*x" > x” lu dans la table à 2 (K — 1) degrés de liberté et au seuil & choisi, 
alors l’hypothèse HO est rejetée, 1l y a donc présomption de multicolinéarité. 


Si *x? < x°, alors nous acceptons l’hypothèse d’orthogonalité. 


1. Farrar D.E. et Glauber R.R., 1967. 
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Exercice n° 4 


LL, fichier C4EX4 


Tests de multicolinéarité 


Un économiste cherche à expliquer la variable y à l’aide de quatre séries explicatives 
X1, X2, X3 et x4. Il désire auparavant tester une éventuelle multicolinéarité entre ces 
quatre séries ; pour ce faire, il dispose des données du tableau 2. 


Tableau 2 — Ces séries statistiques sont-elles colinéaires ? 


y X1 X2 X3 X4 
8,40 82,90 17,10 92,00 94,00 
9,60 88,00 21,30 93,00 96,00 

10,40 99,90 25,10 96,00 97,00 
11,40 105,30 29,00 94,00 97,00 
12,20 117,70 34,00 100,00 100,00 
14,20 131,00 40,00 101,00 101,00 
15,80 148,20 44,00 105,00 104,00 
17,90 161,80 49,00 112,00 109,00 
19,30 174,20 51,00 112,00 111,00 
20,80 184,70 53,00 112,00 111,00 


On demande donc d’appliquer les tests suivants : 
1) test de Klein, 
2) test de Farrar-Glauber. 


Solution 


1) Test de Klein 
a) Régression : y = &o + 41 X1 + 42 X2 + A3 X3 + A4 X4 + €. 
Les résultats de l’estimation sont les suivants : 
y = —13,53 + 0,096 x; + 0,015 x2 — 0,199 x3 + 0,34 x4 + e 
(1,80) (3,66) (0,30) (2,20) (2,27) 
n = 10 
R? = 0,998 
(.) = t de Student 


b) Calcul des coefficients de corrélation simple entre les variables explicatives : 


r2 2 = 0,976 r2 ,3 = 0,960 r2 4 = 0,974 
r2, 3 = 0,938 r2, 4 = 0,938 r2, 4 = 0,982 


À la lecture de ces coefficients il ne semble pas ressortir des risques graves de mul- 
ticolinéarité puisque tous les coefficients de corrélation simple sont inférieurs au coeffi- 
cient de détermination. Toutefois, nous observons qu’ils sont tous très élevés. 
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2) Test de Farrar-Glauber 


Calcul du déterminant 


1 Fx1 x2 x x3 V1 x4 
D = F2 x1 1 F2 x3 F2 x4 = 
Fx3 x1 Fx3 x2 1 Fx3 x4 
Fra x1 Fx4 x2 Vx4 x3 1 
1 0,988 0,980 0,987 
0,988 1 0,969 0,969 _s 
7 [0,980 0,969 1 0,991 di) 


0,987 0,969 0,991 1 


La valeur empirique du * x? calculée à partir de l’échantillon est : 


1 
#72 = É 1 sCK+5]x1nD 

1 
é=-[0-1-5@xs+5]x-115 2752 


Cette valeur est à comparer à la valeur lue dans la table : 
x à K (K — 1) = 10 degrés de liberté et pour un seuil œ = 0,05, soit : 
x° = 18,31 
Puisque *x? > x?, nous rejetons l'hypothèse HO, il y a présomption de multicoli- 
néarité. 


Ces deux tests conduisent donc à des résultats différents, cependant le test de Farrar- 
Glauber, dont le fondement théorique est plus affirmé, semble devoir être privilégié. 


omment remédier à la multicolinéarité ? 


Nous ne ferons que citer les différentes techniques permettant d’apporter des 
solutions au problème de multicolinéarité, le lecteur intéressé par les dévelop- 
pements méthodologiques peut se rapporter à Judge!. 


+ Augmenter la taille de l'échantillon : cette technique n’est efficace que si 
l’ajout d'observations diffère significativement de celles figurant déjà dans le 
modèle, sinon il y aura reconduction de la multicolinéarité. 


+ La « Ridge Regression » est une réponse purement numérique, il s’agit de 
transformer la matrice X’X en (X’X + c1) où c est une constante choisie arbi- 
trairement qui, en augmentant les valeurs de la première diagonale, réduit les 
effets « numériques » de la multicolinéarité. 


1. Judge G.G. et al, pages 874-882, 1988. 
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Face à ces artifices de calcul, la seule parade vraiment efficace consiste, lors 
de la spécification de modèle, à éliminer les séries explicatives susceptibles de 
représenter les mêmes phénomènes et donc d’être corrélées entre elles, ceci afin 
d'éviter l'effet de masque. 


Au paragraphe suivant, nous présentons des méthodes permettant de déter- 
miner le « mix optimal » de variables explicatives. 


élection du modèle optimal 


Dans la pratique, l’économètre est souvent confronté au choix de plusieurs 
variables explicatives x1, x, ..., x, candidates pour expliquer la variable y. Des 
procédures statistiques permettent de déterminer quelles variables retirer ou 
quelles variables ajouter dans un modèle. Cette démarche exclut tout raisonne- 
ment économique car elle permet d’aboutir à des modèles économétriques qui 
sont souvent bons sur le plan statistique mais dont l’interprétation économique 
s'avère nulle, voire aberrante. Ces techniques automatiques de sélection de 
variables explicatives sont donc à manier avec prudence. 


Au problème de la sélection des variables explicatives s’ajoute celui du choix 
à effectuer entre plusieurs modèles concurrents, c’est-à-dire des modèles dont 
les variables sont toutes significatives mais qui ne sont pas les mêmes. 


La question se pose alors de sélectionner le meilleur modèle. 


Le critère de maximisation du R? (coefficient de détermination) consiste à 
retenir le modèle dont le R? est le plus élevé. Ce critère présente l’inconvénient 
de ne pas arbitrer entre la perte de degrés de liberté du modèle et l’ajustement 
qui en résulte. C’est pourquoi on préfère utiliser les critères de Akaike! ou de 
Schwarz? afin de comparer des modèles impliquant un nombre différents de 
variables explicatives. 


Nous retenons le modèle qui minimise la fonction de Akaïke (Akaïike 
Information Criterion) : 


R 2k 
AIC =In (=) ne 
n n 
ou de Schwarz (Schwarz Criterion) : 
SCR kL 
SC =Ln ( ) AC 
n 


n 


1. Akaide H., 1973 ; 1974. 
2. Schwarz, 1978. 
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Avec : 

Ln = Logarithme népérien, 

SCR = somme des carrés des résidus du modèle, 
n = nombre d’observations, 

k = nombre de variables explicatives. 


Nous allons examiner cinq méthodes qui vont nous permettre de retenir le 
meilleur modèle, celui qui est composé des variables qui sont : 


— les plus corrélées avec la variable à expliquer ; 


— les moins corrélées entre elles. 


Toutes les régressions possibles 


Il s’agit de la méthode la plus simple dans son exposé : nous estimons toutes 
les combinaisons de régressions possibles (2° — 1 possibilités, & = nombre de 
variables explicatives candidates) et le modèle retenu est celui dont le critère de 
Akaike ou de Schwarz est minimum pour un modèle comportant des variables 
explicatives toutes significatives. La limite d’utilisation de cette méthode est liée 
au nombre initial de variables explicatives candidates, par exemple si k = 10, le 
nombre de combinaisons possibles est de 1023. 


L’élimination progressive (« Backward Elimination ») 


Cette procédure consiste, sur le modèle complet à & variables explicatives, à 
éliminer de proche en proche (c’est-à-dire en réestimant l’équation après chaque 
élimination) les variables explicatives dont les de Student sont en dessous du 
seuil critique. Cette procédure n’est utilisable que si la première équation peut 
être effectivement estimée, ce qui n’est pas toujours le cas. En effet, lorsque le 
modèle comporte un nombre important de variables explicatives, le risque de 
colinéarité entre ces variables est élevé et la matrice X’X peut être singulière. 


La sélection progressive (« Forward Regression ») 


Dans cette procédure, on sélectionne, dans une première étape, la variable 
explicative dont le coefficient de corrélation simple est le plus élevé avec la 
variable y, soit x; cette variable. La deuxième étape consiste alors à calculer les 
coefficients de corrélation partielle r°,., pour j £ à et à retenir la variable expli- 
cative ayant le coefficient le plus élevé. La sélection s’arrête lorsque les r de 
Student des variables explicatives sont inférieurs au seuil critique. 


La régression pas à pas (« Stepwise Regression ») 


Cette procédure est identique à la précédente, sauf qu’après avoir incorporé 
une nouvelle variable explicative, nous examinons les # de Student de chacune 
des variables explicatives préalablement sélectionnées et nous éliminons du 
modèle celle(s) dont le : du Student est inférieur au seuil critique. 
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La régression par étage (« Stagewise Regression ») 


C’est un processus de sélection de variables explicatives permettant de mini- 
miser les intercorrélations entre les séries explicatives par étude du résidu. 


+ 1° étape 


La variable explicative dont le coefficient de corrélation simple est le plus 
élevé avec la variable y est sélectionnée, soit x; cette variable. 


+ 2° étape 
Calcul du résidu de la régression de y sur x; : 
€ = Y — do — di x; 


Les coefficients de corrélation simple entre le résidu e, et les variables expli- 
catives sont calculés, nous retenons la variable explicative dont le coefficient est 
le plus élevé. Soit x; cette variable explicative. 


+ 3° étape 
Nous calculons un nouveau résidu : 
€ — Y — do — di X; — dx; 


Les coefficients de corrélation simple entre le résidu e, et les variables expli- 
catives sont calculés, nous retenons la variable explicative dont le coefficient est 
le plus élevé, ce qui permet de dégager un nouveau résidu. 


La procédure est arrêtée lorsque les coefficients de corrélation ne sont plus 
significativement différents de O. 


Exercice n° 5 


LH, fichier CAEX4 


Méthodes de sélection de variables explicatives 


En utilisant les cinq procédures décrites précédemment et en reprenant les données 
du tableau 2, on demande de sélectionner, parmi la (ou les) variable(s) explicative(s) can- 
didate(s), celle(s) dont le pouvoir explicatif est le plus important. 


Solution 


a) Toutes les régressions possibles 


Nous devons estimer (2Ë — 1 = 24 — 1) 15 modèles. 
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Tableau 3 — Résultats des 15 régressions (les coefficients non significativement 
différents de O sont en caractères gras, italiques) 


Mi Séries X1 R2 | AIC! | SC 
Coefs. 0,118 0,995 |- 2,185|- 2,125 
t de Student| 41,9 
M2 Séries X2 
Coefs. 0,327 0,967 |- 0,199) 0,138 
t de Student| 15,3 
M3 Séries X3 
Coefs. 0,516 0,952 | 0,185 | 0,245 
t de Student| 12,5 
M4 Séries X4 
Coefs. 0,663 0,978 |— 0,583|- 0,523 
t de Student| 18,6 
M5 Séries X1 X2 
Coefs. 0,132 | — 0,039 0,996 |- 2,058|- 1,967 
t de Student| 6,91 0,72 
M6 Séries X1 X3 
Coefs. 0,126 | — 0,036 0,996 |- 2,026|- 1,936 
t de Student] 8,42 0,53 
M7 Séries X1 X4 
Coefs. 0,102 0,090 0,996 |- 2,087|- 1,996 
t de Student| 5,60 0,86 
MB Séries X2 X3 
Coefs. 0,209 0,194 0,975 |- 0,273|- 0,183 
t de Student| 2,55 1,48 
M9 Séries X2 X4 
Coefs. 0,137 0,395 0,988 |— 0,993|- 0,903 
t de Student | 2,42 3,45 
M10 Séries X3 X4 
Coefs. — 0,166 | 0,871 0,979 |— 0,457|- 0,366 
t de Student| 0,73 3,04 
M11 Séries X1 X2 X3 
Coefs. 0,139 | —0,038 | — 0,035 0,996 |- 1,898|- 1,778 
t de Student| 5,58 0,66 0,49 
M12 Séries X1 X2 X4 
Coefs. 0,115 — 0,028 0,074 0,996 |- 1,926|- 1,805 
t de Student| 3,55 0,48 0,64 
M13 Séries X1 X3 X4 
Coefs. 0,104 | —-0,188 0,319 0,998 | — 2,59 |- 2,469 
t de Student| 7,46 2,47 2,62 
Mi4 Séries X2 X3 X4 
Coefs. 0,164 | —0,300 0,720 0,993 |- 1,304|- 1,183 
t de Student | 3,32 1,99 3,81 
MI15 Séries X1 X2 X3 X4 
Coefs. 0,097 0,015 — 0,199 | 0,340 | 0,998 |- 2,408|- 1,804 
t de Student| 3,66 0,30 2,20 2,27 


1. Nous utilisons les formules de la section IV afin de calculer les critères d’information de Akaïke 


et de Schwarz, le logiciel Eviews utilise des formules légèrement différentes. 
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Parmi ces 15 équations, laquelle est la meilleure ? 


* Il faut éliminer celles dont un ou plusieurs ratios de Student (sauf en ce qui concer- 
ne le terme constant dont nous acceptons qu’il soit non significativement différent 
de 0) sont inférieurs au seuil critique (environ 2,30) : M5, M6, M7, M8, M10, M11, 
M12, M14, M15. 


+ Parmi les 6 équations restantes, on sélectionne celle dont le critère de Akaïke et de 
Schwarz est le plus faible!, d’où M13 : 


choix : X1 X3 X4 


À partir de cet exemple, nous prenons la dimension du travail à mener? et les limites, 
donc, de cette méthode. 


b) L’élimination progressive 


+ Estimation du modèle complet 


À partir du modèle estimé avec 4 variables explicatives, nous retirons la variable dont 
le ratio de Student est le plus faible, soit x2. 


+ Estimation à 3 variables 


Le modèle estimé est le modèle [M13], toutes les variables sont significatives 
(t* > 2,30), la procédure de sélection s’arrête : 


choix : X1 X3 X4 


c) La sélection progressive 


+ Calcul des coefficients de corrélation entre y et x1, X2, x3, x4 
Pyxi — 0,997 ; Pyx2 — 0,983 ; Pyx3 = 0,975 ; Pyx4 = 0,988 


La première variable sélectionnée est x1. 


+ Estimation des 3 modèles à deux variables explicatives : x1 et x2,x1 et x3,x1 et xa. 


Modèles : [M5], [M6] et [M7]. Dans ces trois modèles la nouvelle variable explicative 
n’est jamais significative, la procédure est terminée : 


choix x: 
d) La régression pas à pas 


+ Calcul des coefficients de corrélation entre y et x1,x2,x3,x4. La première variable 
sélectionnée est x1. 


+ Estimation des 3 modèles à deux variables explicatives : x1 et x2, x1 et x3,x1 et xu, 
dans chacun de ces modèles au moins une des variables n’est pas significative, la 
procédure est donc terminée et nous sommes ramenés au cas précédent : 


choix x: 


1. Nous constatons qu’il s’agit aussi de l’équation dont le R? est le plus élevé. 
2. Et pourtant nous n’avons que quatre variables explicatives candidates. 
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e) La régression par étage 


+ Calcul des coefficients de corrélation entre y et x1,x2,x3,x4. La première variable 
sélectionnée est x. 


* Régression et calcul de e, = y +1,24 — 0,11 x, (modèle [M1]) 


ei 


—0,123762 
0,475231 
—0,127120 
0,236519 
—0,424754 
0,007913 
—0,419014 
0,078300 
0,017027 
0,279659 
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+ Calcul des coefficients de corrélation entre e; et x1, x2, x3, x4 
Pei x1 — 0,000 5 Del x2 — —0,040 5 Del x3 — —0,039 5 Del x4 — 0,048 


Le coefficient de corrélation entre e, et x, est par construction nul puisque l’infor- 
mation relative à x, n’est plus contenue dans le résidu (ou encore les vecteurs e, et x; 
sont orthogonaux). 


Les autres coefficients de corrélation ne sont pas significativement différents de O, la 
procédure de sélection est donc terminée : 


choix x: 


Commentaires : 


Seule la procédure de l’élimination progressive ne fournit pas les mêmes résultats de 
sélection que les quatre autres procédures. Il apparaît au vu de ces résultats que si l’éli- 
mination progressive ne maximise pas le R?, elle permet, en revanche, de sélectionner 
une information plus abondante en terme de variables explicatives. 


Dans la pratique, la procédure la plus utilisée est la régression pas à pas, c’est cette 
dernière qui est disponible dans la plupart des logiciels d’économétrie. 
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roblèmes particuliers : 
la violation 
des hypothèses 


e chapitre est consacré aux problèmes particuliers liés au non- 
respect des hypothèses. Nous nous attachons particulièrement à 
deux formes classiques : 
- en |, l'autocorrélation des erreurs ; 
- en Il, l'hétéroscédasticité. 
L'étude de ces deux phénomènes nous permet de définir un nouvel esti- 
mateur : l'estimateur des moindres carrés généralisés, utilisé lorsque la 
matrice des variances et covariances de l'erreur ne répond plus aux hypo- 
thèses classiques, telles que nous les avons supposées réalisées jusqu'à 
maintenant. 
Pour chacun de ces deux cas, nous présentons les méthodes d'investiga- 
tion : tests de détection, conséquences et procédures d'estimation. 
Enfin, la section III. est consacrée au cas où les variables sont observées 
avec erreur. 


‘autocorrélation des erreurs 


résentation du problème 


Jusqu'à maintenant, nous avons considéré que, lors de l’estimation des para- 
mètres du modèle, les hypothèses suivantes sont toutes respectées. 
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+ H1 : le modèle est linéaire en x,. 

+ H2 : les valeurs x, sont observées sans erreur. 
°H3:E(s) = 0. 

° H4: E(e?) = 07. 

°HS:E(s er) =0 sit £t. 

+ H6 : Cov (x,, &,) = 0. 


La spécification de la matrice des variances-covariances de l’erreur est : 


E(e; ei) Eee) ... E(eie,) 
= Etes = E(e: 81) ÆE(ese) ... E(ee,) _ 
Fees E(e, &) ... E(e,e, 
o2 0 O0 0 
_ 0 ©? 0 0 
0 0 0 .… 0? 


Lorsque l’hypothèse HS n’est plus vérifiée, la matrice E(ee’) = 2, £ o?1 n’a 
plus cette forme particulière (elle n’est plus composée de 0 à l’extérieur de la 
première diagonale, puisque Cov (&,, 8) 0) et les estimateurs obtenus par la 
méthode des MCO sont sans biais mais ne sont plus à variance minimale, en 
effet : 

0; = E{(@G — a)(@ — a)} = (X'X) " X'E(ee’) X(X'X) ! = 
= (XX) '(X Q, X)(X'X) 

C'est-à-dire que à est un estimateur dont la première diagonale de la matri- 

ce des variances et covariances est supérieure à celle de o?(X'X) !. 


Nous sommes donc amenés à nous poser trois questions : 

— Comment déterminer un nouvel estimateur pour a ? 

— Comment détecter une éventuelle autocorrélation des erreurs ? 
— Quelles méthodes d’estimation doit-on utiliser ? 


‘estimateur des Moindres Carrés Généralisés (MCG) 


Considérons le modèle linéaire général 


Y = X a + € 
(n, 1) Ga kK+I) (+11) (n,1) 


dans lequel E(ee’) = 9, Z£ o?1 (9. est de dimension n, n). 


Nous désirons déterminer un estimateur de a qui ait les mêmes propriétés 
que l’estimateur des MCO : sans biais, fonction linéaire de Y et à variance mini- 
male. Il est démontré que cet estimateur est donné par : 
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A =AX OT X) CNT) [1] 
Q; =(X D" X)! [2] 


Cet estimateur est appelé estimateur des Moindres Carrés Généralisés 
(MCG) ou encore estimateur de Aitken. 


Remarque : lorsque les hypothèses classiques sont satisfaites, nous retrou- 
vons l’estimateur des MCO : 


a=(X 9" X)  (X D'Y)= 


—1 
= (x (= 1) x) (x (= 1) r) = (X'X) !(X'F) 


Dans la pratique, nous ne connaissons pas la matrice {2,, les formules ci-des- 
sus ne sont pas utilisables, sauf dans des cas exceptionnels. Il convient donc de 
présenter des procédures d’estimation opérationnelles. 


es causes et la détection 
de l'autocorrélation des erreurs 


1) Définition et causes 


Nous sommes en présence d’une autocorrélation des erreurs lorsque les erreurs 
sont liées par un processus de reproduction!. Nous pouvons distinguer l’auto- 
corrélation positive (graphique 1) qui est caractérisée par des successions de 
résidus de même signe, de l’autocorrélation négative (graphique 2) qui est carac- 
térisée par une alternance positive et négative des résidus. 


&l+ 


Graphique 1 — Autocorrélation positive 


1. Nous pouvons parler de processus à « mémoire », par comparaison à des processus purement 
aléatoires. 
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Graphique 2 — Autocorrélation négative 


L’autocorrélation des erreurs peut être observée pour plusieurs raisons : 

— l’absence d’une variable explicative importante dont l’explication rési- 
duelle permettrait de « blanchir »! les erreurs ; 

— une mauvaise spécification du modèle, les relations entre la variable à 
expliquer et les variables explicatives ne sont pas linéaires et s’expriment 
sous une autre forme que celle du modèle estimé (logarithmes, différences 
premières, etc.) ; 

— un lissage par moyenne mobile ou une interpolation des données crée une 
autocorrélation artificielle des erreurs due à l’usage de ces deux opérateurs. 


L’autocorrélation des erreurs se rencontre essentiellement dans les modèles 
en série temporelle où l’influence d’une erreur — due à une mauvaise spécifica- 
tion — d’une période sur l’autre est plausible. Dans le cas de modèle spécifié en 
coupe instantanée, nous ne pouvons concevoir une autocorrélation des erreurs 
que si les observations ont été préalablement triées en fonction croissante (ou 
décroissante) de la variable à expliquer. En effet, la collecte des données s’ef- 
fectue de manière aléatoire et la succession des valeurs de la variable à expliquer 
n’a donc aucune raison de générer une autocorrélation des erreurs. 


2) Détection 


La détection d’une éventuelle dépendance des erreurs ne peut s’effectuer qu’à 
partir de l’analyse des résidus, en effet eux seuls sont connus. 
a) Examen visuel des résidus 


L'analyse graphique des résidus permet le plus souvent de détecter un processus 
de reproduction des erreurs lorsque : 


1. Ce terme de « blanchir » vient de la notion de « bruit blanc » (« White Noise »), qui qualifie des 
processus purement aléatoires. 
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— les résidus sont pendant plusieurs périodes consécutives soit positifs, soit 
négatifs : autocorrélation positive (graphique 1) ; 
— les résidus sont alternés : autocorrélation négative (graphique 2). 


Cependant, le plus souvent, l’analyse graphique est délicate d’interprétation 
car le dessin des résidus ne présente pas des caractéristiques toujours évidentes. 
b) Test de Durbin et Watson 


Le test de Durbin et Watson (DW) permet de détecter une autocorrélation des 
erreurs d’ordre 1 selon la forme : 


8 = PE 1 + v, avec v, — N(0, o?) 


Le test d’hypothèses est le suivant : 


HO : o =0 
H1:0420 


(ou p < 0 ou p > 0, attention le seuil n’est alors pas le même). 


Pour tester l’hypothèse nulle HO, nous calculons la statistique de Durbin et 
Watson : 


n 
> (e " en) 
__ 122 


DW [3] 


où e, sont les résidus de l’estimation du modèle. 


De par sa construction, cette statistique varie entre O0 et 4 et nous avons 
DW =2 lorsque 9 — 0 (9 est le p observé). Afin de tester l’hypothèse HO, 
Durbin et Watson ont tabulé les valeurs critiques de DW au seuil de 5 % en fonc- 
tion de la taille de l’échantillon n et du nombre de variables explicatives (k). La 
lecture de la table permet de déterminer deux valeurs d; et d, comprises entre 0 
et 2 qui délimitent l’espace entre 0 et 4 selon le schéma 1 : 


d 2 : 4-d 4 
| p> 0 2 p =0 p=0#%, be 0 


Schéma 1 — Interprétation du test de Durbin et Watson 


Selon la position du DW empirique dans cet espace, nous pouvons conclure : 


— dy < DW <4-— d,, on accepte l'hypothèse HO — 9 = 0; 
— 0 < DW < d,, on rejette l'hypothèse HO — p > 0; 
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—4-—d, < DW < 4, on rejette l'hypothèse HO — p < 0; 
— di < DW < d, ou 4—-d, < DW<4-d4, ; 


nous sommes dans une zone d’indétermination, ou zone de doute, c’est-à-dire 
que nous ne pouvons pas conclure! dans un sens comme dans l’autre. 


Le graphique 3 illustre ces règles de décision. 


( fa 


d D dd 4-8 


&, 


Graphique 3 — Densités de probabilité de d, et d, 


Conditions d'utilisation : 
— le modèle doit comporter impérativement un terme constant? ; 
— la variable à expliquer ne doit pas figurer parmi les variables explicatives (en 


tant que variable retardée), il faut alors recourir à la statistique h de Durbin 
(cf. chapitre 7, L. B.) ou au test de Breusch-Godfrey (cf. ci-dessous) ; 


— pour les modèles en coupe instantanée, les observations doivent être ordon- 
nées en fonction des valeurs croissantes ou décroissantes de la variable à 
expliquer ou d’une variable explicative soupçonnée être la cause de l’auto- 
corrélation ; 


— le nombre d’observations doit être supérieur ou égal à 15. 


Le test de Durbin et Watson est un test présomptif d'indépendance des 
erreurs du fait qu'il utilise les résidus ; de plus, il ne teste qu'une autocorréla- 
tion d’ordre 1°. 


c) Test de Breusch-Godfrey{ 


Ce test, fondé sur un test de Fisher de nullité de coefficients ou de Multiplicateur 
de Lagrange (« LM test », cf. chapitre 3), permet de tester une autocorrélation 


1. Dans la pratique, on accepte l’hypothèse la plus désastreuse ! Cependant il serait licite d’ac- 
cepter l'hypothèse d’indépendance. 

2. Les tables de DW sont généralement tabulées pour des modèles comportant un terme constant, 
cependant il existe des tables pour des modèles sans terme constant. 

3. Cela signifie que le test de Durbin et Watson ne détecte pas une autocorrélation d’ordre supérieur 
à 1, par exemple entre f et f + 4 pour une série trimestrielle qui ne serait pas désaisonnalisée. 

4. Breusch (1978) et Godfrey (1978). 
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d’un ordre supérieur à 1 et reste valide en présence de la variable dépendante 
décalée en tant que variable explicative. L'idée générale de ce test réside dans la 
recherche d’une relation significative entre le résidu et ce même résidu décalé. 


Une autocorrélation des erreurs d’un ordre p s’écrit : 
Er = Pi Es-1 + 2 E5-2 +... + Op Esp + Vi 
Soit le modèle général à erreurs autocorrélées d’ordre p : 


Ve = A Xi + D Xn +... + A Xxs + do + O1 Es + 2 Es-2 +... + Op Ei-p + Us 


Ce test est mené en trois étapes : 


— Estimation par les MCO du modèle et calcul du résidu e,, puisque les 
erreurs sont inconnues, le test porte sur les résidus. 


— Estimation par les MCO de l’équation intermédiaire : 
es = di Xi + do Xa +... + dx Xxs + do + Pi €-1 + O2 5-2 +... + Op ip + Us 


Soit n le nombre d’observations disponibles (attention chaque décalage 
entraîne la perte d’une observation) pour estimer les paramètres du modèle et R? 
le coefficient de détermination. Certains auteurs préconisent, afin de ne pas 
perdre d’observations, de mettre à O0 les premières valeurs du résidu décalé. La 
différence n’est perceptible que pour des petits échantillons. 


— Test d’hypothèses sur l’équation intermédiaire. 


L'hypothèse HO d’absence d’autocorrélation des erreurs à tester est : 


H0: 0 =p=...—=p,=0 


Si on refuse l’hypothèse nulle, alors il existe un risque d’autocorrélation des 
erreurs à l’ordre p. 


Pour mener ce test, nous avons deux possibilités : soit effectuer un test de Fisher 
classique de nullité des coefficients »; (cf. chapitre 3), soit recourir à la statistique 
LM qui est distribuée comme un x? à p degrés de liberté ; si n x R? > x?(p) lu 
dans la table au seuil «, on rejette l'hypothèse d’indépendance des erreurs. 


d) Tests de Box-Pierce et Ljung-Box 


Ces tests présentés au chapitre 9 (section L. C.) permettent de tester un ensemble 
de coefficients d’autocorrélation des résidus d’un ordre égal ou supérieur à 1. 


Exercice n° 1 


LL, fichier C5EX1 


Tests d’indépendance des erreurs 


Soit le modèle à trois variables explicatives : 


Yr = do + di Xi + Q2 Xa + 43 Xÿ + Es 
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Nous disposons des observations annuelles (tableau 1) sur 20 ans : 


Tableau 1 —- Données annuelles (extrait) 


Année y X1 X2 X3 
1 87,40 98,60 99,10 108,5 
2 97,60 101,20 99,10 110,1 
19 110,70 105,30 93,00 108,5 
20 127,10 107,60 106,60 111,3 


Nous nous proposons de déceler une éventuelle autocorrélation d’ordre 1 des erreurs, 
pour cela on demande : 


1) d’estimer les coefficients du modèle ; 

2) d’effectuer l’analyse graphique des résidus ; 

3) de calculer la statistique de Durbin et Watson et d’effectuer le test ; 
4) enfin, d’effectuer le test de Breusch-Godfrey. 


Solution 


1) Les résultats de l’estimation à partir de Eviews sont les suivants : 


Dependent Variable : Y 
Included observations : 20 


Variable Coefficient Std. Error  t-Statistic Prob. 
C —242.7951 26.719995  -9.059538 0.0000 
X1 3.897408 0.400325 9.735616 0.0000 
X2 0.404365 0.061351 6.590977 0.0000 
X3 —0.878886 0.240216 -3.658727 0.0021 
R-squared 0.938895 Mean dependent var 97.53500 
Adjusted R-squared 0.927438 S.D. dependent var 11.83048 
S.E. of regression 3.186826 Akaiïke info criterion 5.332784 
Sum squared resid 162.4937 Schwarz criterion 5.531931 
Log likelihood —49.32784 F-statistic 81.094784 
Durbin-Watson stat 1.053794 Prob(F-statistic) 0.000000 


es trois coefficients des variables explicatives sont significativement différents de 
L i fficients d iabl plicati ignificati diffé de 0 
(5 = 2,12), le Fisher empirique est supérieur au Fisher lu (F?5 = 3,24), le modèle 


semble satisfaisant. 


132 e ÉCONOMÉTRIE 


2) Eviews fournit directement le graphique des résidus. 


6 


4 


-6 
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— Y Resituals 


L'analyse de ce graphique révèle des résidus qui semblent cycliques, ceci est symp- 
tomatique d’une autocorrélation positive des résidus. 


3) Les conditions d’utilisation du test de Durbin et Watson sont bien respectées : le 
modèle est spécifié en série temporelle, le nombre d’observations (n = 20) est 
supérieur à 15 et, enfin, le modèle estimé comporte un terme constant. 


Le calcul de la statistique à partir des résidus est alors : 


DC L At 
= : 171,23 


S ” 162,49 


t=1 


DW 


= 1,053 


Cette valeur est à comparer à celles lues dans la table de Durbin et Watson à n = 20 
et k = 3, soit di = 1,00 et d; = 1,68. La valeur DW se situe dans la zone de doute 
(dj < DW < d; — incertitude), cependant à proximité immédiate de la zone de rejet de 
HO, nous pouvons plutôt conclure à une autocorrélation positive des résidus, donc à une 
présomption de dépendance des erreurs. 


4) Les données étant annuelles, nous testons une autocorrélation d’ordre 2, un ordre 
supérieur à deux ans ne semble pas justifié. Nous estimons donc le modèle : 


€ = di Xi + 2 Xa + 43 X3 + do + O1 €-1 + 2 €-2 + Vs 
Soit : &, = —17,26 + 0,5287x1, — 0,0369x>, — 0,3149x3, + 0,589 e,_1 — 0,497e,_» 


avec : R? = 0,33 etn = 18 (car nous avons perdu deux observations du fait du déca- 
lage). 
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LM =nR? = 18 x 0,33 = 5,94 < x$,5(2) = 5,99, nous sommes à la limite d’ac- 
ceptation de l’hypothèse HO pour un seuil de 5 %. 


Nous testons alors un ordre 1, soit l’estimation suivante : 
ê, = —11,82 + 0,087 x1, — 0,0158 x, — 0,044 x3, + 0,507e,_; 
avec : R? = 0,196 et n = 19, d’où LM = 19 x 0,196 = 3,72 < Xéo5(1) — 3,84. 


Nous sommes, là encore, à la limite d’acceptation (probabilité critique &«° = 5,37 %) 
de l’hypothèse HO, compte tenu de toutes ces informations (test de Durbin-Watson, test 
de Breusch-Godfrey), nous sommes enclins à accepter l’hypothèse d’autocorrélation des 
erreurs. 


Les estimateurs que nous avons trouvés sont sans biais mais non à variance mini- 
male, il convient donc de déterminer une procédure adéquate d’estimation. 


Il est à noter que tous les commentaires de la question 1 concernant la validité sta- 
tistique du modèle sont maintenant caducs. 


es procédures d'estimation en cas 
d'autocorrélation des erreurs 


1) Principes généraux 
Si nous retenons l’hypothèse d’une autocorrélation des erreurs d’ordre 1, le 
modèle linéaire s’écrit : 

Y=Xa+e 


avec 
&=Ppeitu pl <1 [4] 


(processus autorégressif d’ordre 1 : AR(1) )! où v, — N(0; o?) et Elu; wr) = 0 
pour ft £f'. 
En procédant par substitution successive de [4], nous obtenons : 


Er — pp Es-2 + 7) + vu = p° Er-2 + (p V1 + v,) 


2 3 [5] 
Er = UV + D Vi + 0° V2 + D V3 +... 


Ce processus tend vers 0 puisque [p| < 1. 


Nous allons étudier les propriétés de &,. 


1. On note les processus autorégressifs par : AR(p), où p est l’ordre du processus autorégressif. 
Le chapitre 9 est consacré à l’étude générale de ce type de processus. 
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E(e,) = E(pe,_; + v,) = pE(e,_1) + E(u,) = 0 


E(e?) = E(pes 1 + vu)? = p?E(e?.)+ E(v?) car v, est indépendant de &,. 


La variance de &, étant homoscédastique, nous avons : E(e?) = E(e? ,) = 02. 
Soit : o2(1 — p°) = 07 — 67 = —— [6] 
Cov(e,,8;41) E# E(e,,8,41) E(e;,(pe, nl Vi41)) = pOË 
Cov(E,,8,42) — E(e,,8,4) ee E(e,(pes + Vi42)) 4 PE(E,,E;41) Es p°0} 

p'o, 


(=97 


La matrice des variances-covariances de l’erreur dans ce cas est alors : 


Cove, 84) = E(e,8) = p'o? = 


1 p p? pt 1 
p 1 D: Lis ie 
9, = E(ee) = — p° p 1 ... p"* | aveco Z1 
1 — 0? 
p""! p"? p" 1 
L’estimateur des MCG est égal d’après [1] : 
a=(X D X)'(X DUT) 
où 
Il —p 0 0 0 
—p 1+p?7  —p 0 0 
: 1 (0) —p  l+p? —p 0 
il — 
ere lle 
(0) _ …. 1+p?7 —-p 
0 2e 0 —p 1 


Cependant, nous ne connaissons ni le terme p, ni la variance o? ; nous allons 
donc chercher une transformation matricielle M telle que le modèle 
MY = MXa + Me ait ses erreurs indépendantes et homoscédastiques. 


Soit : 
E(Me(Me)) = E(Mee M') = ME(ee') M'= MA, M'=0?1 


Dans ce cas, on peut déterminer l’estimateur BLUE de a par la méthode des 
MCO : 


ä=((MX) MX) (MX) MY=(X M MX) 'X M'MY [7] 
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En identifiant terme à terme [1] et [7] on obtient : 


M'M=A0" —=0?09" puisque si l'égalité [1] = [7] est vérifiée pour 
M'M = 9", elle l’est aussi pour À." quel que soit À. 


É 1 HR 
M 0 —p 1 O0 ... 0 


ie 0 —p 1 | 
0 0 0 ... —o 1 


remplit cette condition puisque : 


La matrice 


p? —p 0 O0 0 
—p 1+p?7  —p O 0 
M'M = 0 —p  l+p? —p .…. 0 
(0) 4 …. 1+p?7 —p 
de LS Üt «=», à 


et a? (27' sont identiques au premier terme près p? au lieu de 1. 


Ainsi, nous pouvons substituer à la méthode des MCG, la méthode des MCO 
(si n est suffisamment grand) appliquée au modèle linéaire MY = MXa + Me 
qui n’est autre que le modèle initial dans lequel les variables sont transformées 
par un passage aux quasi-différences premières!. En effet : 


Y2 — D Yi Xe — P Xxi 
MY = Y3 — D Y2 et MX, = Xk3 — P Xe 


Yn — 0 Yn-1 Xkn — 0 Xkn-1 


Cas particulier : lorsqu'il y a autocorrélation parfaite (o = 1), nous 
sommes amenés à appliquer la méthode des MCO sur le modèle en différences 
premières. 


Nous allons montrer à partir d’un exemple le bien-fondé de la transformation 
en quasi-différences. 


Soit le modèle à deux variables explicatives : 
Ye = Q9 + di Xi + GX + & [8] 
avec 6, = p & 1 + v, avec [p| < 1 (vu, — N(0; 6?) et Eu, v!) = 0 pour tr Z f'). 
Le modèle [8] peut s’écrire en r — 1 : 
Yi = do + di Xu1 + Q2 Xi + 5 [9] 
Le calcul de [8] —o [9] nous donne : 


Ye — Pi = ol — D) + aix — DXu-1) + GX — PXu-1) + (Es — PE) 
dy: = D + a dx + & dx, + v 


1. Cette transformation entraîne la perte d’une observation, toutefois on peut remplacer la première 
observation par /1 — p2y1 et /1 — p?xx. 


136 e ÉCONOMÉTRIE 


Le terme aléatoire v, répond aux hypothèses d’application de la méthode des 
MCO, nous pouvons donc utiliser les procédures d’estimation des MCO sur les 
variables transformées. Les estimations des coefficients calculées à partir du 
modèle en différence s’interprètent directement comme étant les coefficients du 
modèle initial, sauf en ce qui concerne le terme constant : 

ao = bo/( — p) 


Si nous connaissons la technique d’estimation permettant de lever l’autocorré- 
lation d’ordre 1, nous pouvons l'appliquer de manière opérationnelle, 1l convient 
d’estimer le paramètre ». C’est l’objet des procédures d’estimations suivantes. 


2) Procédures d'estimation de » 
Les procédures suivantes ne sont valides que si : &;, = p &,_1 + v. 


a) Estimation directe de p à partir des résidus de la régression 
sur le modèle initial 


Étape 1 : estimation de p de deux manières. 


* par régression directe de e, sur e, : 
P= = @=0) [10] 


* ou à partir de la statistique de Durbin et Watson 


_ DW 


En effet, le numérateur de la statistique de Durbin et Watson est égal à : 


n n n n 
d@—e)=N +) e,-2% ee, 
t=2 t=2 t=2 t=2 
En divisant par le dénominateur de cette même statistique et sachant que 


n 
| €rer-1 
1=2 


2 2 
e +e 
— — _ EH 1 n 
Pere, = — 7, nous avons DW—=2—20, 


) : 2 > 2 
€; ê; 
t=1l 1=1 

2 2 
1 n 


n 


2 
DE 
1=1 


tend vers 0. 


si nest grand, 
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Étape 2 : transformation des variables et régressions! sur les quasi-différences : 
De — Dei = bo + &u — PXu-1) +... + Qt — Ours) + Vs 


Les paramètres estimés par MCO sont alors : &,...@& et & = b /A — D). 


b) Estimation itérative du vecteur a et de p (méthode de Cochrane-Orcutt) 
Étape 1 : initialisation de p. 


Par une technique d’estimation directe par régression [10], on fixe une pre- 


mière valeur à p soit : __— 
Po — P 


Étape 2 : régression sur les quasi-différences : 

Ve — PoY-1 = Do + Xi — PoXu-1) + 2. + (Xe — PoXu-1 + Vi 
Les paramètres estimés sont alors : &, ...&, et & — b /A — Go). 
Étape 3 : réestimation de p. 


À partir des nouveaux résidus d’estimation (el) nous recalculons une nou- 
velle valeur de » soit à: : 


Ce = Yi — do — diXy — .. — dx Xxs 


n 

@) ,4) 
; 8) es 
=; 


a = 
Pi — DAZU 
à t 
t 


Étape 4 : régression sur les quasi-différences : 
Ve — Bi = bo + Qu — Pix) + 222 + Qu — Pie) + V 


" 2 2 N : e 
Puis nous calculons un nouveau résidu (e! à partir de la nouvelle estima- 
tion des coefficients, ce qui nous permet d’obtenir un ;. 


Et ainsi de suite jusqu’à la stabilité des coefficients a; estimés (en général 3 
ou d itérations). 


c) Méthode du « balayage » (« Hildreth-Lu ») 


Étape 1 : détermination du type d’autocorrélation. 

À partir de la statistique de Durbin et Watson, on détermine une autocorréla- 
tion positive ou négative (p < 0 ou p > 0). 

Étape 2 : régression pour l’intervalle des valeurs possibles de ». 


Par exemple, on sait que p € [0; 1], nous régressons pour toutes Les valeurs 
successives de p = {0,1; 0,2; ...0,9; 1} sur l’intervalle [0 ; 1] avec un pas fixé 
ici égal à 0,1, l’équation : 


Ye — Pi V1 = bo + Gi — Pixar) + 2. + (Xe — DiXs-1) + Vi 


1. Nous perdrons une observation lors de la transformation en différences. 
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et nous retenons la valeur de p qui minimise la somme des carrés des rési- 


dus (X&). 


t 
Il est possible d’affiner la valeur estimée de » en réemployant la même pro- 
cédure sur un intervalle restreint et avec un pas plus fin (par exemple 0,01). 


Il est à noter que cette technique est optimale selon le critère des moindres 
carrés puisque l’on retient le o qui minimise la somme des carrés des résidus. 


Exercice n° 2 


LL, fichier C5EX1 


Procédures d’estimation en cas d’autocorrélation des erreurs 
d’ordre 1 


En reprenant le modèle de l’exercice 1 (et les données du tableau 1) dans lequel nous 
avons détecté une autocorrélation des erreurs, on demande d’en corriger les effets à l’ai- 
de des quatre procédures présentées. On comparera les résultats. 


Solution 


La solution de cet exercice est réalisée à l’aide du programme Eviews (3) CSEX2.PRG 
a) Estimation directe de po à partir des résidus de la régression sur le modèle initial 


Étape 1 : régression, calcul des résidus et estimation de ». 


Les résultats de la régression ainsi que le calcul des résidus ont déjà été présentés lors 
de la résolution de l’exercice 1. 


+ Première possibilité : par régression de e, sur e,_; 


Résultats 


Dependent Variable : e 


Included observations : 19 after adjustments 


Variable Coefficient | Std. Error t-Statistic Prob. 

C 0.065400 0.643073 0.101700 0.9202 

e(- 1) 0.464845 0.241301 1.926413 0.0709 
Pi = 0,46 


Étape 2 : transformations des variables et régression sur les quasi-différences 


+ Calcul des quasi-différences : 
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genr dy — y—raul *y(—1) 

genr dx1 = x1 — raul *x1(—-1) 
genr dx2 = x2 — raul *x2(—1) 
genr dx3 = x3 — raul *x3(—1) 


+ Régression 


Dependent Variable : DY 

Included observations : 19 after adjustments 

Variable Coefficient | Std. Error | t-Statistic Prob. 
C —135.5132 | 18.38346 | -7.371473 | 0.0000 
DX1 3.593675 0.583072 6.163342 0.0000 
DX2 0.439019 0.071365 6.151765 0.0000 
DX3 — 0.514596 | 0.337097 | -1.526550| 0.1477 


Calcul du terme constant : 
& = b/( — Di) = —135,51/(1 — 0,46) — —253,22 


e Deuxième possibilité : estimation de p à partir de la statistique de Durbin et Watson 


_ DW 1,053 
P2 —= 1 — 1 —= 0,473 
2 2 


Étape 2 : transformations des variables et régression sur les quasi-différences. 


Le calcul est identique au précédent avec la nouvelle valeur de po. 


Dependent Variable : DY 


Included observations : 19 after adjustments 


Variable Coefficient | Std. Error t-Statistic Prob. 

C — 133.4095 | 18.14245 | -7.353445 | 0.0000 
DX1 3.580221 0.583673 6.133954 0.0000 
DX2 0.440490 0.071400 6.169361 0.0000 
DX3 — 0.503033 | 0.336991 |-1.492721| 0.1562 


Calcul du terme constant : 
À = bo/A — 02) = —133,40/(1 — 0,47) — —253,20 


b) Estimation itérative du vecteur a et de p (méthode de Cochrane-Orcutt) 
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+ Estimation d’un modèle autorégressif d’ordre 1 


LS Y C X1 X2 X3 AR(1) 


Dependent Variable : Y 

Included observations : 19 after adjustments 

Variable Coefficient | Std. Error | t-Statistic Prob. 
C —250.3442 | 38.62520 | -6.481369 | 0.0000 
X1 3.142385 0.573681 5.477582 0.0001 
X2 0.497558 0.069854 7.122783 0.0000 
X3 — 0.144028 | 0.306106 | -0.470517| 0.6452 
AR(1) 0.811373 0.336991 5.048921 0.0002 
Durbin-Watson stat = 2.149 


Pa = 0,81 


Il est à noter que le logiciel calcule directement la valeur de o (assortie de son écart 
type) ainsi que l’estimation du terme constant du modèle initial. 


c) Méthode du « balayage » (« Hildreth-Lu ») 


Les résultats sont identiques à ceux de la méthode de Cochrane-Orcutt. 


Tableau 2 — Récapitulation des résultats 


MÉTHODES 
Paramètres a a b c 
Régression DW C.O. H.L. 


Les coefficients de régression en italique ne sont pas significativement différents de 0 
(pour un seuil de 5 %). 
À la lecture des résultats (tableau 2), nous constatons que : 


_ Î égression a; n’est jamais significativement différent de 0, alors 
le coefficient de régression a3 n 
que, dans le modèle initial, à erreurs autocorrélées, tous les coefficients sont signi- 
ficatifs ; 
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— les deux méthodes d’estimation directe des résidus aboutissent à des résultats qua- 
siment identiques, il subsiste néanmoins une autocorrélation des erreurs ; 

— les deux méthodes itératives (C.O. et H.L.) donnent des résultats identiques, mais 
assez différents des deux méthodes précédentes. 


Laquelle choisir ? Cette question est sans réponse définitive, la plus répandue est certai- 
nement la méthode de Cochrane-Orcutt. Les deux procédures d’estimation directe sont 
plus un artifice de calcul qu’une méthode proprement dite ; la technique du « balayage » 
aboutit à des résultats similaires à celle de Cochrane-Orcutt. 


Nous sommes dans le domaine de l’estimation statistique donc avec des marges d’er- 
reurs qui peuvent parfois dépasser le raffinement de telle ou telle méthode, c’est pour- 
quoi nous pouvons recommander d’utiliser la technique la plus simple à mettre en œuvre 
donc celle directement utilisée par le logiciel habituel. 


Il convient de plus de noter que ces méthodes particulières d’estimation constituent 
une réponse technique à un problème le plus souvent de spécifications économiques. 
Nous recommandons, donc, plutôt que d’appliquer immédiatement ces procédures, de 
réfléchir à une spécification plus adaptée du modèle. 


'hétéroscédasticité 


résentation du problème 


Soit le modèle Y = Xa +£ pour lequel l'hypothèse H4 n’est pas vérifiée, la 
matrice des erreurs est alors : 


Eee) Eee) ... E(e:e,) 
Dette) E(e &) Eee) ... E(ee,) 
Ee, ei) Ee,e)) ... E(e, 8) 

o2 0 O0 0 

_ | 0 o2 0 0 

0 0 O0 o? 


Les variances des erreurs ne sont plus constantes sur la première diagonale. 


Ce problème se rencontre plus fréquemment pour les modèles spécifiés en 


142 e ÉCONOMÉTRIE 


coupe instantanée ou bien lorsque les observations sont représentatives de 
moyennes. La variance de l’erreur est alors liée aux valeurs de la variable expli- 
cative comme l’illustrent les graphiques 4 à 6. 


} 


x 


Graphique 4 - Modèle homoscédastique 


F 


(a) 


Graphique 5 — La variance de l’erreur croît avec la variable explicative 


Graphique 6 — La variance de l’erreur décroît avec la variable explicative 


Les conséquences de l’hétéroscédasticité sont identiques à celles de l’auto- 
corrélation des erreurs, c’est-à-dire : 


— estimateur sans biais ; 
— l’estimateur de MCO n’est plus à variance minimale. 
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Les causes de l’hétéroscédasticité sont multiples : 


— comme nous l’avons déjà cité, lorsque les observations représentent des 
moyennes calculées sur des échantillons de taille différente ; 

— un autre cas résulte de la répétition d’une même valeur de la variable à 
expliquer pour des valeurs différentes d’une variable explicative, par 
exemple lors de regroupements en tranches (de salaires, d’effectifs..….) ; 

— lorsque les erreurs sont liées aux valeurs prises par une variable explicati- 
ve, dans un modèle en coupe instantanée la variance de la consommation 
croît, par exemple, avec le revenu disponible, etc. 


Dans le cas d’une hétéroscédasticité révélée, le test de Chow (cf. chapitre 3, 
section B.) est biaisé, nous risquons alors de rejeter à tort! l'hypothèse HO de la 
stabilité des coefficients du modèle. Si, lors d’un test de Chow, nous sommes 
amenés à accepter l’hypothèse HO, le problème ne se pose donc pas ; en 
revanche, dans le cas du rejet de HO, il convient préalablement de corriger 
l’hétéroscédasticité et d’effectuer le test de Chow sur le modèle transformé. 


orrection de l'hétéroscédasticité 


L’estimateur BLUE du modèle hétéroscédastique est alors celui des MCG : 
G=(X 0 XX QT) 
avec DR O EX)" 


Il n’existe pas une méthodologie unique de correction, à la différence de la 
correction de l’autocorrélation d’ordre 1 des erreurs, mais des méthodes que 
l’on applique en fonction de la cause présumée de l’hétéroscédasticité. La règle 
générale consiste à déterminer une transformation? concernant les données — de 
la variable à expliquer et des variables explicatives — afin de se ramener à un 
modèle à variances constantes (homoscédastique). Les exercices 3 et 4 illustrent 
les principales méthodes. 


Exercice n° 3 


L+, fichier C5EX3 


Correction de l’hétéroscédasticité lorsque les données représentent 
des moyennes 
Afin de tester l’efficacité d’un nouveau fortifiant sur la croissance des poulets, un éle- 


veur a retenu 40 poulets répartis en cinq groupes de tailles inégales et leur a administré 
des doses différentes de ce fortifiant. Les résultats sont consignés sur le tableau 3. 


1. C'est-à-dire trop souvent. 
2. Cette transformation consiste à déterminer un vecteur de pondération pour chaque observation, 
d’où le nom de régression pondérée. 
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Tableau 3 — Relation entre le poids des poulets 
et la dose de fortifiant 


Groupe Nombre Poids moyen Dose moyenne 

i de poulets des poulets administrée 
ni y: Xi 

1 12 1,7 5,8 

2 8 1,9 6,4 

3 6 152 4,8 

# 9 2,3 6,9 

5 5 1,8 6,2 


On demande d’estimer les coefficients de la relation : 
Yi = ao + ai Xi +e; 
relation entre le poids de chacun des poulets Y; et la dose individuelle reçue X; et de tes- 
ter si le coefficient a; est significativement différent de 0. 


Solution 
+ Estimation des coefficients 
Nous ne connaissons que la relation entre les moyennes, soit : Ÿ; = ap + ai X; + £; 


Les variables représentent des moyennes, donc la variance de l'erreur &; 
2 

est égale à : Var(£;) = —. 
ni 


1 FE F6, 


1 

n = D (Var(e1) + Var(e2) +... + Var(e,)) 
1 o? 

= —(n; x 6?) = — (les covariances Cov(&;,e;) = 0,i # j). 


En effet, Var(e;) — Var( 


La matrice des variances et covariances des erreurs est donc la forme : 
1 


ni 


na 
1 
ns 


Puisque le modèle est hétéroscédastique, nous allons utiliser l’estimateur des MCG : 


a=(X D x)! (XD »)=(X VX) (XVI) 


i i x; 

VTh=| n3 | d’où (XV! X) = nes _ | 
hi À; hi À; 

| É 


ns 
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Le tableau de calcul 4 permet d’obtenir les résultats dont nous avons besoin. 


Tableau 4 — Exemple de calcul en cas d’hétéroscédasticité 


Y; x; ni ni Ÿ; niX; niX; nY; niX;Y; 
1,7 5,8 12 20,4 69,6 403,68 34,68 118,32 
1,9 6,4 8 15,2 51,2 327,68 28,88 97,28 
1,2 4,8 6 12 28,8 138,24 8,64 34,56 
23 6,9 9 20,7 62,1 428,49 47,61 142,83 
1,8 6,2 5 9,0 31,0 192,20 16,20 55,8 
Total 40 72,5 242,7 |1490,29 | 136,01 448,79 
40 242,7 | 2,1040  —0,3426 
y 22 ; _ ; » 
CR ne. 1  … : | —0,3426 | 
72,5 —1,23 
t X'V_!Yy)= ? it a— | 
à EU ee pe LEE | . 

Nous pouvons remarquer que la matrice M telle que V-! = M’ M est égale à : 

Vi 

Vie 
M = V3 
Vs 


L’estimateur des MCG est alors égal à : 
à =[(MX) (MX), '[MX)(MY)] = (X' M' MX) '(X' M! MY) 


Nous aurions donc trouvé les mêmes résultats en employant la technique de la 
régression pondérée, c’est-à-dire par multiplication du vecteur des observations de la 
variable à expliquer (Y) et du vecteur de la variable explicative (X) par la matrice M 
(dont la forme générale est ,/n; ). La méthode des MCO appliquée aux données trans- 
formées (y compris le terme constant) suivantes conduit donc à des résultats identiques : 


Y:: 1,7 x V12 1,9 x V8 1,2 x V6 2,3 x V9 1,8 x V5 
X;:: 5,8 x VI2 6,4 x V8 4,8 x V6 6,9 x V9 6,2 x V5 
U;: 1x V12 1 x V8 1 x V6 1 x V9 1x V5 


Nous remarquons que : Var(,/n;e;) = o? 


+ Estimation de la variance de l’erreur 


, l’hétéroscédasticité est donc levée. 


Un estimateur sans biais de 6? peut être déduit de l’application des MCO à la rela- 
tion précédente : 


Le e'e (MY — MXG) (MY — MXà) 
opel n—k-—1 

ne Y—Xa) M'M(Y — Xà) 

s n—k—1 
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0e X&) V-!(Y — X@) 


* n—k-—1 
Nous connaissons : 
0,0161 12 
—0,0885 8 
Y—Xàä= | 0,0238 | :v-!— 6 
0,0575 9 
—0,0869 5 


L’estimation de la variance de l’erreur est donnée par : 
re (Y — Xà) V-!(Y — Xà) _ 0,1369 
k n—k—1 5—-1-1 
(n est le nombre d’observations servant à estimer les paramètres, ici n = 5). 


= 0,0445 


+ Estimation de la variance des coefficients 


La matrice des variances et covariances des coefficients est : 


2,1040  —0,3426 | 


D, = G2(X VX)! = 0,0445 
e( ) —_0,3426 0,05647 


soit 
67, = 0,0445 x 2,1040 = 0,094 et 62 = 0,0445 x 0,0565 = 0,00251 
Le coefficient a, est-il significativement différent de O ? 


t* = 0,502/0,05 = 10,04 > pe = 3,18, nous rejetons l’hypothèse HO, le fortifiant 
a une influence positive sur le poids des poulets. 


ests de détection de l'hétéroscédasticité 


Nous allons présenter, à partir d’un exercice, différents tests permettant de 
détecter une hétéroscédasticité. 


Exercice n° 4 


LH, fichier C5SEX4 


Tests de détection d’une hétéroscédasticité et correction 


Un directeur de la production d’une unité de construction automobile désire déter- 
miner une relation entre le nombre de défauts constatés (Y;) et le temps de vérification 
(X;) d’une automobile, selon le modèle suivant : 


Y: = ao + a Xi +u; 


Pour ce faire, il procède à un test sur 30 véhicules qu’il regroupe en 6 classes de 5 
voitures en demandant à chaque chef d’atelier de passer un nombre d’heures de vérifica- 
tion fixé. 


Les résultats sont consignés dans le tableau 5. 
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Tableau 5 — Relation entre temps de vérification 
et nombre de défauts 


Nombre de défauts Y, Temps passés 
en heures X; 
4 5 6 8 8 # 
6 11 13 15 17 3,5 
9 13 14 15 21 2 
6 13 16 23 26 1,5 
11 15 17 22 34 1 
7 21 23 28 38 0,5 


On demande de procéder aux tests de détection d’hétéroscédasticité suivants : 


1) test d'égalité des variances ; 
2) test de Goldfeld-Quandt ; 
3) test de Gleisjer ; 

4) test de White ; 


5) puis, en cas d’hétéroscédasticité, d’en corriger les effets. 


Solution 


1) Test d’égalité des variances 


Les données sont constituées de m = 6 groupes d’observations. Nous allons tester 
l'égalité des variances!, soit l'hypothèse : 


H0 :07=0?=...= 0 


Étape 1 : calcul de la variance empirique pour chaque groupe. 


ni 5 
Dar La-rY 
22 j=1 el 


; nl 5 4 


Étape 2 : calcul de la variance totale. 


avec u=m-letv=ÿ =) (m1) 


Étape 3 : calcul du x? empirique et test. 


1. Kendall M.G. et Stuart A., pages 234-236, 1961. 
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m 
La quantité Q' = v Ln 6? — + v; Ln 6? suit une loi du x? à m—1 degrés de 
i=1 


liberté (Ln = logarithme népérien). Cependant, l’estimation peut être améliorée en divi- 
sant Q’ par une constante d’échelle C : 


1 Aer 9. 2 
C=I = =] 
Tu D (© _ .) ainsi Q C — x" (mn ) 


SiQ > X6. 95 Un — 1), l’hypothèse HO est rejetée, le modèle est hétéroscédastique. 
Le tableau 6 illustre les étapes de calcul. 


Tableau 6 - Étapes de calcul pour un test d'égalité de variances 


l y: X; 6? v; En (6?) 
1 4 5 6 8 8 4 3,2 4,65 
2 6 11 13 15 17 3,5 17,8 11,51 
3 9 13 14 15 21 D, 18,8 11,73 
4 6 13 16 23 26 1,5 63,7 16,61 
5 11 15 17 22 34 1 78,7 17,46 
6 7 21 23 28 38 0,5 127,3 19,38 


Gr = 51,58333 


Q'—13,26; C—1,097; Q—12,09 > X os (mn — 1) = 11,07, le modèle est 
donc hétéroscédastique. 


2) Test de Goldfeld-Quandt! 


Ce test n’est valable que si l’une des variables est la cause de l’hétéroscédasticité et 
que le nombre d’observations est important. I1 se compose de trois étapes. 


Étape 1 : ordonner les observations en fonction des valeurs croissantes ou décrois- 
santes de la variable à expliquer ou bien de la variable explicative soupçonnée être la 
source de l’hétéroscédasticité. 


Cette opération est déjà effectuée puisque le nombre de défauts constatés est classé 
(tableau 7) en fonction du nombre d’heures décroissant de vérification. 


Tableau 7 - Classement des observations en fonction 
du temps de vérification (extrait des données) 


j ÿ, À; 
1 4 4 
2 5 4 

29 28 0,5 

30 38 0,5 


1. Goldfeld S.M. et Quandt R.E., pages 539-547, 1965. 
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Étape 2 : omettre C observations centrales. 


Nous choisissons arbitrairement C observations situées au centre de l’échantillon. 
Ces C observations sont exclues de l’analyse. La valeur de C doit être approximative- 
ment égale au quart du nombre d’observations totales. 


C = partie entière de (30/4) = 8 


Étape 3 : régressions sur les deux sous-échantillons et test. 


Premier échantillon : j = 1,11 Deuxième échantillon : j = 20,30 
Y; =16,93-—-72,13 X;+e; Y;=9,84—1,32 X;+e; 
(2,31) (9,23) 
n=1l n=I1l 
R? = 0,08 R? = 0,002 
SCRi = Ÿ ei = 164,66 SCR = De? = 872,02 
j j 
(.) = t de Student (.) = t de Student 
ddl =n—-2—9 ddl; =n—-2—9 


Sous l'hypothèse HO d’homoscédasticité, le rapport! : 


SCR;/ddl 872,02/9 ï : : 
= CR = Se = 5,29 suit une loi de Fisher à ddl; et ddl: degrés 


de liberté. 


* 


F* = 5,29 > Fe = 3,18, l’hypothèse d’homoscédasticité HO est rejetée, le mo- 
dèle est donc hétéroscédastique. 
3) Test de Gleisjer? 


Le test de Gleisjer permet non seulement de déceler une éventuelle hétéroscédastici- 
té, mais aussi d'identifier la forme que revêt cette hétéroscédasticité. Ce test est fondé sur 
la relation entre le résidu de l’estimation par les MCO effectuée sur le modèle de base et 
la variable explicative supposée être la cause de l’hétéroscédasticité. 


Étape 1 : régression par les MCO de }; en X; (j = 1,30) 


Y; = 24,09 — 4,12 X;+e; 
(4,19) 
n = 30 
R? = 0,38 


Le vecteur des résidus e; est alors connu. 


1. La valeur la plus élevée des deux SCR se situe toujours au numérateur. 
2. Gleisjer H., pages 316-323, 1969. 
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Étape 2 : régression de la valeur absolue [e;| des résidus sur X;. 


Gleisjer suggère de tester différentes formes de relation, par exemple : 


Forme générale Estimation (J = 1,30) 
T lel=a+a X; +; le;| = 8,09 — 1,46 X, + 5; 
n—30 (2,55) 
Hétéroscédasticité de type : R? = 0.19 


2 


Ga = k° X° (K étant une constante quelconque) 


En effet, si nous avons une relation entre la valeur absolue du résidu (e.) et la variable 
X,, cela signifie que nous avons de fait une relation entre le résidu au carré et la variable 


au carré. 
I le=ao+a X° +; le;l = 10,7—4,15 X;/° +6; 
(2,60) 
n = 30 
G2=kRX; 
R? = 0,19 
I le = a+ X;' +; le;| = 2,79 +2,86 X7' +5, 
(2,30) 
2 Ep x n = 30 
É L R? = 0,16 


L'hypothèse d’homoscédasticité est rejetée si le coefficient a, d’une des spécifications 
est significativement différent de 0. Les trois ‘ de Student empiriques sont supérieurs à 
1,96, l’hétéroscédasticité est donc détectée. La forme retenue est la IT ; en effet, le coeffi- 
cient est affecté du ratio de Student le plus élevé (toutefois, la forme I est très proche). 


4) Test de White! 


Le test de White est très proche du précédent, il est fondé sur une relation significa- 
tive entre le carré du résidu et une ou plusieurs variables explicatives en niveau et au carré 
au sein d’une même équation de régression? : 


2 2 2 2 
ei = diXye + Dix, + dix + box, +... + axes + beXE, + Go + v 


Soit n le nombre d’observations disponibles pour estimer les paramètres du modèle et 
R? le coefficient de détermination. Si l’un de ces coefficients de régression est significa- 
tivement différent de 0, alors on accepte l’hypothèse d’hétéroscédasticité. Nous pouvons 
procéder à ce test soit à l’aide d’un test de Fisher classique de nullité de coefficients : 


HO : di = b; = d=b;=...-a =b; =0 
Si on refuse l’hypothèse nulle, alors il existe un risque d’hétéroscédasticité. 


Soit recourir à la statistique LM qui est distribuée comme un x? à p = 2 k degrés 
de liberté (autant que de coefficients que nous estimons, hormis le terme constant), si 
n x R? > x?(p) lu dans la table au seuil & , on rejette l’hypothèse d’homoscédasticité 
des erreurs. 


1. White, 1980. 


2. En cas de doute sur une influence croisée de deux variables comme étant la source de l’hétéro- 
scédasticité, on peut ajouter au modèle à estimer des termes croisés, par exemple : x1;, X xx. 
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Soit ici à estimer le modèle : e? = aix; + bix? + ao + v; 
€ = —78,58 x; + 11,98 x? + 136,02 + 5 


avec n — 30; R?2— 0,226; F* = 3,956 


— Test de Fisher F* = 3,956 > Fj%, = 3,35. 


— Test LM n R? = 30 x 0,22 = 6,78 > x205(2) = 5,99. 


Nous sommes, dans les deux cas, amenés à rejeter l’hypothèse HO pour un seuil de 5 %. 
Le modèle est donc hétéroscédastique. 


5) Correction de l’hétéroscédasticité 


Les quatre tests sont concordants : le modèle est hétéroscédastique, il convient donc 
d’en corriger les effets. 


Supposons, par exemple, que l’on retienne la forme I : 6% = k? X°; l’application de 
la régression pondérée par le facteur 1/X; conduit à un modèle homoscédastique : 


Y; a e; e; \? 1 
Res tre d’où r(2) = — 6 =k 


Î Î Î 


Or, le test de Gleisjer a mis en évidence une relation (ID) du type : 62 = k? X;. Pour 
lever l’hétéroscédasticité, dans ce cas, nous employons la régression pondérée sur les 
données brutes divisées par ,/X;. En effet : 


En général, lorsque nous avons détecté une hétéroscédasticité de type : 
G2 = k? f(X;), il convient de diviser les données par / f(X;) afin de se ramener à un 


ej 
modèle homoscédastique. 


Dans le cadre de notre exercice, les données sont alors transformées (tableau 8). 


Tableau 8 - Transformation pour une régression pondérée 
(extrait des données) 


Z Ë x Ne x & 

j — 1j — 27. — 

J 5e J 5e iJ. x; 
2,00 0,50 2,00 
2,50 0,50 2,00 
39,60 1,41 0,71 
53,74 1,41 0,71 
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Le modèle estimé par les MCO est le suivant : 


Zj = biXi; + b2X); + 6j, &; répond aux hypothèses classiques. Il est à noter l’ab- 
sence du terme constant. Les résultats fournis par Eviews sont : 


SPL la 35 
30 Observations 
LS #4 Üsependent Variable ie € 


VARIABLE COEFFICIENT  STO, ERTOR T-STAT. 2-TAIL Si, 
CE KL 24.960028 | ET 5120458 9, SSETEET 9. GOÛ 
x2 -2.5976024 1.5410077 2.941568 Ô. GÜG 
R-squared 0.642593 Mean of dependent var 14.429533 
Adjusted RB-squared 9.629766 S. D. of dependent var 12.441598 
SE. of regression ° 7.570315 Sum of squared resid 1604. 671 
Durbin-Walson stat 1.718781 F-statistic 50.22h94 
Log likelïhood 102.260 
Les coefficients du modèle initial sont & — Pi — 24,96 et & = D = —4,53. Le 


modèle estimé! est donc : 
Y; = 24,96 — 4,53 X; +e; 


(2,94) 
n = 30 
(.) = t de Student 


Il existe bien une influence significative du temps de vérification sur le nombre de 
défauts constatés, chaque heure de vérification permet de supprimer en moyenne 
4,5 défauts. 


utre test d'hétéroscédasticité : le test ARCH 


Les modèles de type ARCH° (« AutoRegressive Conditional Heteroscedasti- 
city ») permettent de modéliser des chroniques (la plupart du temps financières?) 
qui ont une volatilité (ou variance ou variabilité) instantanée qui dépend du passé. 
Il est ainsi possible d’élaborer une prévision dynamique de la chronique en 
termes de moyenne et de variance. Le test est fondé soit sur un test de Fisher clas- 
sique, soit sur le test du multiplicateur de Lagrange (LM). 


De manière pratique, on procède de la manière suivante : 
— 1" étape : calcul de e, le résidu du modèle de régression ; 


1. Ce modèle est à comparer à celui estimé sur les données brutes (premier modèle du test de 
Gleisjer). 
Le coefficient de détermination n’est pas présenté, car, dans tout modèle estimé sans terme 
constant, il n’est pas interprétable. 

2. Engle, 1982. 


3. En effet, les séries financières sont particulièrement concernées par les modèles ARCH, car on 
constate des périodes de forte spéculation (variabilité élevée) suivie de périodes d’accalmie (varia- 
bilité faible). 
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— 2° étape : calcul des e?; 

— 3° étape : régression autorégressive des résidus sur p retards (résidu décalé) 
P 

où seuls les retards significatifs sont conservés, e? = ao + > a; e 
i=1 


2 … 
t—i 9 


Soit à tester l'hypothèse HO : &, = &; =... = a, = 0. 


— 4° étape : calcul de la statistique du multiplicateur Lagrange, LM = n x R? avec : 
n = nombre d’observations servant au calcul de la régression de l’étape 3, 
R? = coefficient de détermination de l’étape 3. 


Si LM > x°(p) à p degrés de liberté lu dans la table à un seuil « fixé (en 
général 0,05), on rejette HO ; on considère que le processus est justifiable d’un 
modèle ARCH(p). 

C’est le test de significativité des coefficients a; de la régression e? sur &, 
qui permet de déterminer l’ordre p du processus ARCH sachant qu’un proces- 
sus ARCH d’ordre 3 semble un maximum. Une autre approche consiste à 
calculer le corrélogramme des résidus aux carrés issus du modèle initial. Si des 
termes de ce corrélogramme sont significativement différents de 0, alors on peut 


conclure à une spécification de type ARCH. 


odèles à erreurs sur les variables 


onséquences lorsque les variables sont entachées 
d'erreurs 


Quand nous avons étudié le modèle linéaire, nous avons admis que la variable 
endogène et les variables exogènes étaient observables sans erreur. Dans la pra- 
tique, cette hypothèse est rarement vérifiée ; cependant, nous pouvons admettre, 
généralement, que l’erreur de mesure des observations est faible par rapport à 
l’erreur de spécification. 


Toutefois, dans certains modèles, les variables économiques retenues peu- 
vent être entachées d’une erreur de mesure relativement importante. C’est le cas, 
par exemple, lorsque les données proviennent, non pas, d’une mesure directe, 
mais de données d’enquêtes par sondage. Dans ce cas, il convient de distinguer 
les variables vraies (et inconnues) : y*, xŸ, x;,...,x des valeurs observées 
Y, X1, 32, .., X Et d'étudier les conséquences concernant les propriétés de l’es- 
timateur obtenu par les MCO. 


Soit le modèle Y* = X*a + # avec & qui satisfait aux hypothèses habituelles. 
Posons : X=X'}u et Y=Y" + 


avec: E(u)=0 ; E(v)=0; E(X*u)=0 ; E(Y*v)=0 ; E(X*v)=0; 
E(Y*u) = 0. 
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On a alors : 
E(e'u) = E{(Y* — X'a)'u} = E(Y*u) — a'E(X*u) =0 
E(e'v) = E{(Y* — X*a)'v} = E(Y*v) — a'E(X*v) = 0 


Nous avons donc indépendance entre les erreurs sur les variables y et v, et l’er- 
reur de spécification du modèle &. 


La relation entre les variables observées X et Y est la suivante : 
Y'=Y-v=(X-ua+e- Y=Xa+v-ua+e-=Xa+n 
avec =Vv-ua+E 
Les propriétés stochastiques de n sont : 


E(n) = E(v — ua +e) = E(v) — E(u)a + E(e) = 0 
E(X*n) = E(X*v) — E(X*n)a + E(X*'e) = 0 
E(X"n) = E{(X* + n)'n} = E(un) 
= E(u'v) — E(u'n) a + E(u'e) 
= —E(u'u)a £ 0 


L'hypothèse H6 du modèle général n’est donc pas vérifiée puisque n et X sont 
corrélés, la méthode des MCO fournit des estimateurs biaisés négativement. 


a méthode des variables instrumentales 


NS 


Lorsqu'on se trouve en présence d’un modèle à erreurs sur les variables 
Y = Xa+n, l'hypothèse H6 est en défaut et l’estimateur & ne converge pas 
asymptotiquement vers a. Les autres hypothèses sont réputées vérifiées. 


Le but de la technique des variables instrumentales est de déterminer k 
variables z:, 22, ..., z, telles que : 


E(Z'n) = 0 et Z = (i, Z2: -.., Zx) 


Cov (Z'X) £ 0 


c’est-à-dire qu'aucune combinaison linéaire des variables z, n’est orthogonale 
aux variables x, x, ..., x, ou encore que les variables Z et X soient corrélées. 


Nous avons alors : 


E(Z'Y) = E{Z'(Xa + n)} = E(Z'X)a + E(Z'n) = E(Z'X)a 
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soit ä=(Z'X) 'Z'Y [12] 


On démontre! que & est un estimateur convergent de a, la variance de l’es- 
timateur & est d’autant plus faible que la corrélation entre Z’X est forte, la 
matrice des variances et covariances des coefficients est égale à : 


D =GUZX) (ZX 2)" [13] 


La difficulté de mise en œuvre de cette méthode réside dans la sélection des 
variables instrumentales? « miracles » Z qui doivent être non corrélées avec n 
et fortement corrélées avec X. Dans certains cas, nous pouvons simplement rete- 
nir, comme variable instrumentale, la variable exogène décalée d’une période. 


e test d'exogénéité d'Hausman 


Le test d’exogénéité d’Hausman (1978) permet de détecter une éventuelle cor- 
rélation entre le terme d’erreur &, et une ou des variables explicatives x;,. Dans 
cette hypothèse, nous ne pouvons plus utiliser l’estimateur des MCO qui est non 
convergent, 1l faut alors recourir à la méthode des Variables Instrumentales (VI) 
ou à la Méthode des Moments Généralisée (GMM). 

Soit le test d’hypothèses, HO : Cov(x,,s,) = 0 (la variable x, est exogène) contre 
l'hypothèse d’endogénéité H1 : Cov(x,,8,) £ 0. 

Sous l’hypothèse HO les estimateurs des MCO et des VI sont convergeant alors 
que sous l’hypothèse H1 la covariance est non nulle et l’estimateur des MCO est 
biaisé et non convergeant. Ce test peut être mené de deux manières, soit un test 
de différence entre l’estimateur des VI et des MCO, soit un test à partir d’une 
régression augmentée. 


1) Test de différence 
Nous calculons la statistique : 
H = (avr — amco) [Var(avr) — Var(ayco)T "(avr — amco) - 


La statistique Æ est distribuée selon un chi-deux à k degrés de liberté. Si 


H < x°(k) pour un seuil « % fixé, nous acceptons l’hypothèse HO, l’estimateur 
MCO est non biaisé. 


1. Judge G.G. ef al., pages 577-579, 1988. 


2. Les anglo-saxons emploient le terme de « proxy variable », que l’on peut traduire littéralement par 
« variable par délégation ». 
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2) Régression augmentée 
La procédure proposée par Hausman est en quatre étapes : 


— Estimation d’un modèle par les MCO avec pour variable à expliquer la 
variable dont nous désirons tester l’exogénéité et comme variables explica- 
tives le ou les instruments, le plus souvent les variables explicatives décalées 
d’une période. 

— Estimation de la ou des variables ajustées *;, à partir de la ou des régressions 
précédentes. 

— Estimation du modèle augmenté (modèle initial dans lequel nous rajoutons la 
ou les variables explicatives ajustées à,,). 

— Test de significativité par rapport à O du ou des coefficients de la ou des 
variables explicatives ajustées. Si ce ou ces coefficients ne sont pas significa- 
tivement de 0 (test de Student ou de Fisher), alors nous retenons l’hypothèse 
HO : Cov(x,,8,) = 0. 


a méthode des moments généralisée 


La Méthode des Moments Généralisée, GMM (Generalized Method of 
Moments), est utilisée lorsque la ou les variables explicatives sont supposées 
exogènes (Cov (x,,8,) Æ 0) et que, de plus, la matrice des variances covariances 
des erreurs est quelconque (E(6,,8!) Æ o?1). L’estimateur des GMM combine 
alors la méthode des moindres carrés généralisés avec celle des variables instru- 
mentales. L’estimateur des GMM est donné par : 


àâ=(X'Z(Z'@Z) ZX) X'Z(Z'QZ) Z'y [14] 


avec : 
y = la variable à expliquer 
X = les variables explicatives 


Z = les instruments 


£2 = la matrice des variances covariances des résidus estimés dans une première 
étape par la méthode des variables instrumentales 


Il est à noter que dans le cas où les hypothèses classiques sont vérifiées 
(E(@,,6!) = o°1), l’estimateur des GMM (expression [14]) se ramène à l’esti- 
mateur VI (expression [13]). 
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Exercice n° 5 


LL, fichier C5EX5 


Test d’exogénéité d’Hausman, modèle à erreurs sur les variables : la 
technique des variables instrumentales 


Un agronome désire estimer la relation entre le rendement de blé (y;) et la quantité 
utilisée d’engrais (x*). Pour ce faire, il ne dispose que de la quantité d’engrais (x;) 
déclarée par l’agriculteur, qui est donc entachée d’une erreur. Cependant, il pense que la 
variable de dépense effective en achat d’engrais (z;) est indépendante de l’erreur d’ob- 
servation de la quantité d’engrais déclarée et bien corrélée avec la consommation réelle 
d’engrais. 


On dispose des vingt observations présentées au tableau 9. 


Tableau 9 - Rendement de blé, quantité d'engrais utilisée 
et dépense en achat d'engrais 


Observation Yi X; 2; 
1 15,30 17,30 3,00 
19,91 21,91 7,00 
3 20,94 22,96 5,40 
18 25,83 29,43 22,20 
19 25,15 28,95 24,60 
20 25,06 28,86 24,60 


On demande : 
1) de tester une éventuelle endogénéité de la variable x; à l’aide du test d’Hausman ; 


2) d’estimer la relation entre y; et x* par une méthode adaptée. 


Solution 
1) Test de différence : Nous calculons la statistique d’Hausman : 


H = (avr — amco) [Var(avr) — Var(ayco)T (avr — amco) 


Avec : 
= [0795] —  _[Oo.822 NS = 0,0004489  —0,01106 1 
MT | 945%] MO | Q47g |? "| 001106  0,27613 | ? 
Vu ne 0.0003486  —0,008597. — =  _[-0.0276]. 
MCO | _0,00859  0,214867 |” “V1 MO | 66817 |’ 


0,0001 er 


[Var(avr) — Var(amco)] = ES? 0,0612 
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1568341,7  63248,1 ][ —0,0276] , 
FE 08e 068171] 63248, 1 al] 0,6817 ]-6 CHA 


pour un seuil de 5 % = 5,99. Nous rejetons l’hypothèse HO, l’estimateur des MCO est 
biaisé, il convient d’utiliser l’estimateur des VI. 


Régression augmentée 
Nous procédons au test d’Hausman en quatre étapes. 


— Estimation par les MCO de la régression de x; sur l’instrument z; : 


Dependent Variable : X 
Method : Least Squares 


Included observations : 20 


Variable Coefficient | Std. Error t-Statistic Prob. 
C 18.37253 0.622495 29.51436 0.0000 
Z 0.440680 0.039908 11.04238 0.0000 


— Calcul de la série ajustée : À; — 18,37 + 0,44z; 


— Estimation du modèle augmenté avec (XF = à;) : 


Dependent Variable : Y 
Method : Least Squares 


Included observations : 20 


Variable Coefficient | Std. Error t-Statistic Prob. 

X 1,010328 0,022324 45,25680 0.0000 
XF —0,215107 | 0,023915 | -8,994504]| 0.0000 
C 2,153561 0,212721 10,12386 0,0000 


— Le coefficient de la variable XF est significativement différent de 0, nous ne sommes 
pas en mesure d’accepter l’hypothèse HO, nous avons donc Cov(x,,8,) £ 0. 


2) La régression de y; sur x; conduit aux résultats suivants : 


= 1,47 + 0,82 X; 
(41) 
R? = 0,99 
n = 20 
(.) = t de Student 


Cependant la méthode des MCO n’est pas applicable car E(x; n) Æ 0. En revanche, nous 
savons par hypothèses que E(z; n) = 0 et que Cov(x* z;) # 0. 


L’estimateur & est donné par [12], soit : 


ä — (Z! X) 7! Z' Y 
(2,1) (2,20) (20,2) (2,20) (20,1) 
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La matrice Z est composée de 1 pour la première colonne et des valeurs de z; pour 
la deuxième colonne. De même, la matrice X est composée de 1 pour la première colon- 
ne et des valeurs de x; pour la deuxième colonne. 


Nous obtenons : 


20,00 |  (Z'Xy*! = 1,02 Fe 


, 


_. | 


in Ps 7.369,53 —0,04 0,00 


6472,88 


it 2 En 2,15 
soi a=|" |- 
ai 0,795 
Ces coefficients sont à comparer à ceux trouvés lors de l’estimation du modèle par 
les MCO. 


Nous pouvons calculer l’estimation de la variance de l’erreur : 
224 
E 1,29 


6° = 7 —=0,071 
Ê n—2 18 


22 


La matrice des variances et covariances de & est alors d’après [13] : 


ec (ZX) (7202) 


| 20,00 284,401... à 3,85 —0,15 
FF. ee el D ee + 
= Ga = 0,0211 


Le modèle estimé à partir de la méthode des variables instrumentales est donc le suivant : 
ÿ = 2,15 + 0,795 X; 
(37) 
n = 20 
(.) = t de Student 


Exercice n° 6 


LL fichier C5EX6 


Prévision de part de marché 


Une entreprise de la grande consommation cherche à prévoir la part de marché d’un 
produit apéritif (PM) en fonction de sa présence dans l’univers de vente l(DN ) et de son 
indice de prix par rapport aux concurrents (/P,). Les données portent sur 41 semaines. 


1. La DN ou distribution numérique représente le nombre de fois où le produit est présent dans la 
distribution GMS (Grande et Moyennes Surfaces). Si DN = 100, cela signifie que le produit est 
présent dans tous les magasins, si DN = 80, le produit est présent dans 80 % des magasins. Bien 
sûr, plus la DN augmente et plus le produit est présent dans les linéaires et donc la probabilité de 
vendre le produit s’accroît. 
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Le chef de produit estime un premier modèle dont les résultats sont présentés ci-des- 
SOUS : 


Log(PM,) = 2,91 +1,03 Log(DN,)+e, 
(48,5) (6,83) 
n = 4] 
R? = 0,54 
DW = 1,29 
() = 1 de Student 
Log — Logarithme népérien 


1) Que représente le coefficient a, du modèle ? Est-il significativement de 0 ? 


2) Le graphique des résidus est le suivant qu’en pensez-vous ? 


LSGIP HN Rasiqus si 


Existe-t-il une autocorrélation des erreurs ? 


3) Le chef de produit ajoute l’indice des prix à son équation de régression et obtient le 
résultat suivant : 


Log(PM,) — 25,22+ 1,28 Log(DN,) — 4,71 Log(1P,)+e, 


(6,7) (10,9) (—5,9) 
n —= 41 
R? = 0,76 
DW = 1,83 


Commentez d’un point de vue statistique et économique les résultats obtenus. 


4) Connaissant pour la semaine 42 les valeurs de DNy = 0,60 et Z Py = 100, on vous 
demande de calculer une prévision de part de marché pour la semaine 42 assortie de son 
intervalle à 95 %. 


On donne la matrice (X'X)”! 
543,63 6,38  —114,92 
(X'X) 7! = | 6,38 0,54  —1,32 
—114,92 —1,32 24,29 


Solution 


1) Le cofficient a, du modèle représente une élasticité car le modèle est sous la forme 
Log-Log. Ce coefficient est significativement de 0 car la valeur empirique du { de Student 
est largement supérieure au f lu dans la table (12% — 1,96). 


2) Le graphique laisse supposer une autocorrélation des erreurs. Puisque les condi- 
tions d’application du test de Durbin et Watson sont vérifiées, nous pouvons interpréter 
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cette statistique : DW = 1,29 < 1,44 (valeur lue dans la table). Il existe une présomp- 
tion d’autocorrélation des erreurs d’ordre 1. 


3) Commentaires des résultats 
Commentaires statistiques : 


* la statistique de Fisher indique que le modèle est globalement significatif, 

- les r de Student ont des probabilités critiques inférieures à 0,05, les coefficients sont 
donc tous significatifs, 

+ la statistique de DW — 1,82 ne laisse plus présager d’une autocorrélation des 
erreurs. 


Nous constatons que le fait d’avoir ajouter au modèle une variable explicative corri- 
ge l’autocorrélation des erreurs. Le modèle est validé sur le plan statistique. 


Commentaires économiques : 


+ la variable DN agit positivement, plus l’entreprise est présente dans l’univers de 
vente plus la part de marché augmente (10 % d’augmentation entraîne 12,5 % d’aug- 
mentation de part de marché), 

* la variable JP agit négativement, il s’agit d’un effet prix classique (10 % d’aug- 
mentation entraîne 47 % de baisse de part de marché), 

Les coefficients des variables ont bien le signe attendu. 


4) On calcule le logarithme népérien : LN(DV) = —0,51; LN(ZP) = 4,605 
La prévision en semaine 42 est donnée par : 
Log(PM) = 25,22 + 1,285 x —0,51 — 4,716 x 4,605 = 2,84 
D'où PM = e2% — 17,18. La part de marché prévue est de 17,18 % 
L'écart type de l’erreur de prévision est égal à : 
GE, = 6 (1+X,4(X'X) 'X45) = (0,16132)°(1 + 0,27) = 0,033. 


€t+h 
1 


avec X,,7 = | —0,51 
4,605 
L’intervalle de prévision à 95 % de Ln(PM) est donné par : 2,84 + 1,96 x ,/0,033. 
Soit IC = [2,483; 3,196] 


Nous passons aux exponentiels afin d’obtenir l'intervalle de confiance de la part de 
marché : [11,95; 24,43]. 


Exercice n° 7 


LL: fichier C5EX7 


Un peu de réflexion économétrique... 

Soit trois variables construites artificiellement connues sur n = 40 périodes. 
*<Ylet Y1 en différences premières : DY1 =Y1-Y1(-1) 

+ Y2 et Y2 en différences premières : DY2 = Y2 -Y2(-1) 

e une variable TENDANCE = 1,2, ,n 
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Les graphiques 7 montrent les variations des variables Y1, Y2, DY1, DY2 en fonc- 
tion du temps. 
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Graphique 7 - Évolution des variables Y1, Y2, DYI, DY2 en fonction du temps 


En vous aidant des graphiques, de la statistique de Durbin-Watson et du coefficient 
de détermination, on demande de marier chacune des 4 régressions proposées (Résultats 
du modèle) avec le couple « Variable dépendante/Variable explicative ». 


Résultats du modèle Variables 
Durbin et Watson R? Dépendante Explicative 
Modèle 1 1,97 0,52 Y1 TENDANCE 
Modèle 2 3,91 0,55 DY1 TENDANCE 
Modèle 3 0,03 0 Y2 TENDANCE 
Modèle 4 0,053 0,52 Y1 DY2 
Solution 


On procède par déduction et élimination. 


+ Modèle 3 : Y1/DY2 car coefficient de détermination quasi nul et très forte auto- 
corrélation des erreurs. 


+ Modèle 2 : Y2/TENDANCE car coefficient de détermination élevé et très forte 
autocorrélation négative des erreurs. 


+ Modèle 1 : DYI/TENDANCE car coefficient de détermination élevé et absence 
d’autocorrélation. 


+ Modèle 4 : Y1/TENDANCE car forte autocorrélation positive des erreurs et coef- 
ficient de détermination élevé. 
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Les graphiques 8 suivants illustrent les autocorrélations et les coefficients de déter- 


mination. 
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Graphique 8 — Illustrations des modèles : autocorrélations 
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et les coefficients de détermination 


es modèles 
non linéaires 


ous avons examiné le cas du modèle linéaire, cependant, très 

souvent, la théorie économique doit être formalisée à l'aide de 

relations non linéaires. 
Dans ce chapitre, la part consacrée au cours est très réduite. En effet, 
l'étude des modèles non linéaires se prête bien à l'exercice pratique. 
Nous examinons tout d'abord en I. les différents types de modèles non 
linéaires : ceux qui sont linéaires sur leurs paramètres et des modèles un 
peu plus complexes (modèle de diffusion, par exemple) qui font l'objet 
d'une étude particulière. Puis, les méthodes d'estimation des paramètres 
des modèles non linéarisables sont présentées en II. 


es différents types de modèles non linéaires 


es fonctions de type exponentiel 


Nous allons examiner le cas de modèles dont la spécification n’est pas linéaire, 
mais qui sont linéaires par rapport à leurs paramètres. 


Exercice n° 1 


LL, fichier C6EX1 


Estimation d’une fonction de production de type Cobb-Douglas 


Nous avons relevé pour 25 entreprises : la production Q, le facteur capital K et le 
facteur travail L ; ces variables sont exprimées en millions d’euros. 
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Une fonction de production de type Cobb-Douglas est de la forme : 
Q = K°*! L? 
On demande : 
1) de donner une interprétation économique des coefficients &, et æ2 ; 
2) d’estimer les paramètres du modèle et de commenter les résultats ; 


3) de calculer le risque & de première espèce concernant l’hypothèse des rendements 
d’échelle constants. 


Les données collectées sont présentées dans le tableau 1 suivant : 


Tableau 1 — Données de production pour 25 entreprises 
(extrait des données) 


K L Q 
8 23 106,00 
9 14 81.08 
3 10 43,21 

ii 121,24 


Solution 


1) Les coefficients &, et > représentent respectivement l’élasticité de la production au 
facteur capital et l’élasticité de la production au facteur travail. 


+ Démonstration : 
Nous avons une relation du type : Q = 9 K°! L®?. 


Une transformation logarithmique conduit à : 
Log(Q) = Log(ao) + 1 Log(K) + «2 Log(L) 
Or l’élasticité de y à x se définit comme étant un rapport de variation relative : 


= Ay/y __ à Log(y) 
7 Ax/x à Log(x) 


Les coefficients æ, et > sont donc des élasticités. 


— rapport de dérivées logarithmiques. 


Dans tout modèle spécifié sous forme Log-Log, les coefficients s’in- 
terprètent directement en termes d’élasticités. 


2) Estimation des coefficients du modèle Log-linéaire 


Le modèle à estimer est donc le suivant : 


Log(Q) — Log(æo) + 1 Log(K) + a2 Log(L) +e 
LO —= ao + œ] LK + LL +E 


où les variables LO, LK et LL (tableau 2) sont les variables Q , K et L transformées. 


Les résultats de l’estimation sont les suivants : 
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25 Observations 
LS -* TDependent Yarisble is LQ 


T=STAT. 


VARIABLE COEFFICIENT STD. ERRDGR EæTalL SIC. 

C 1. 0838457 GC. DSBSBER 19. 052660 O, 000 

LE 0.63893524 D, O3SS 138 11.481133 ©. 000 

LL 0.2543517 CO, OATIATE3 8.29282871 G, O0 
R-squared D, 938754 Mean vf dependent var 1.901200 
Adjusled R-squared 0. 445186 SG. of dependent var 0.157647 
SE. of rogrcssion QG, OAQT4S Eux qi Squared resld 0.036531 
Durbin-Walson ska &.tH1tddi F-statigstic 168.604 

Eog 11kelihocd 48.153241 


Les t* de Student calculés sont tous supérieurs au f lu (# 


0,05 


» = 2,07), les coefficients 


sont donc significativement différents de 0 au seuil de 5 %. 


Tableau 2 — Données transformées en logarithmiques décimaux 
(extrait des données) 


LK = LL= | LO= 
Log(k) Log(L) | Log(Q) 
0,90 1,36 2,03 
0,95 1,15 1,91 
0,48 1,00 1,64 
0,78 1,85 2,08 


Attention, la statistique de Durbin et Watson ne s’interprète pas puisque le modèle 
est spécifié en coupe instantanée. 


L’estimation statistique est donc satisfaisante. 


L’élasticité de la production au capital est égale à : 1 = 0,64. 


L’élasticité de la production au travail est égale à : «3 = 0,25. 


(Si le facteur capital augmente de 10 %, la production augmente de 6,4 % et si le fac- 
teur travail augmente de 10 %, la production augmente de 2,5 %.) 


Le coefficient æ est égal à : oo = 101-084 — 12,13. 


La fonction de production estimée s’écrit : Q = 12,13 K 0,64 p 023 
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3) Les rendements d’échelle sont-ils constants ? 


Les rendements d’échelle sont : 


— décroissants si &1 + œ2 < 1 (la production augmente dans une proportion moindre 
que les facteurs de production) ; 


— constants si &, + @2 = 1 (la production augmente dans une proportion identique aux 
facteurs de production) ; 


— croissants si &1 + æ2 > 1 (la production augmente plus vite que les facteurs de pro- 
duction). 


Or nous avons @&, + @ = 0,89, pour quelle probabilité critique cette valeur est-elle 
significativement inférieure à 1 ? 


On teste donc les hypothèses suivantes : 


HO : + a = 1 


H1:œ +a <1 
Le t calculé de Student est donc égal, sous HO, à : 
sm r@= 1 

O&1+à2 


Or la matrice des variances et covariances des coefficients est fournie par Eviews : 


Die 0. 005256 C,IE 0. G07301 


C. LL 0 001420  TX,LK 0.001261 
0.000749 


LK, LL 0.000314 


a 


Soit 62114 = 681 + 62) + 2 cov (Gi, @) 
= 0,000749 + 0,001261 + 2 x 0,000314 = 0,002638 
Gi+@—1  0,64+0,25—1 


= — = 2,14 = f9,020 
Gar+é2 0,05136 22 


Nous avons 2 % de risques de rejeter l’hypothèse HO à tort, nous pouvons donc 
considérer les rendements d’échelle comme significativement décroissants. 


es modèles de diffusion 


La courbe de vie du produit est une notion utilisée en marketing : les ventes 
évoluent en fonction du temps ; le démarrage est relativement lent lorsque le 
produit est nouveau, puis elles connaissent une croissance rapide. La courbe 
passe ensuite par un point d’inflexion à partir duquel le rythme de croissance des 
ventes diminue. 


Nous allons examiner deux modèles classiquement utilisés. 
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1) Le modèle logistique (ou courbe de Verhulst ou courbe de Pearl) 


Ce modèle est défini par la formulation suivante : 

Ymax 

7 1+br 

où b et r sont les deux paramètres du modèle (0 < r < 1), r définit la vitesse 
de diffusion (plus r est proche de 0, plus vite nous atteindrons l’asymptote) ; b 
est une caractéristique d’ordonnée à l’origine ; y, — seuil de saturation. 


Y 


Si ft — oo alors y, — Ymax, Et Si > —oo alors y, — 0. 
Le point d’inflexion est fixe et est atteint pour y, = ymax/2. 


Le graphique 1 illustre l’allure générale de la courbe logistique. 


) 
seuil de saturation 


Ÿ 1 £ 3 4 5 6 7 à 910 1119 14 1415 16 17 18 19 90 Et 22 


Graphique 1 — La courbe logistique (max = 148,31, b = 10, r — 0,7) 


2) Le modèle de Gompertz 


Ce modèle est défini par la formulation suivante : 
y = e"# > Ln(y) = br'+a 
(e = base du logarithme népérien). 


AVEC Ymax — €" — Seuil de saturation, b et r sont les deux paramètres du 
modèle (b <0et0 <r < 1). 


Si f — oo alors y, — mx, Et Si — —o alors y, — 0. 
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3) Les méthodes d'estimation 


La difficulté d’estimation de ce type de modèles! vient du fait qu’ils ne sont 
pas linéaires. L'emploi du modèle de régression est donc impossible tel quel. 
L’estimation des paramètres d’un tel modèle doit être effectuée par des 
méthodes de régression non linéaire qui nécessitent des procédures numériques 
itératives assez complexes, objet du paragraphe suivant. 


éthodes d'estimation 
des modèles non linéaires 


Nous avons jusqu’à maintenant procédé à des artifices de calcul afin de se rame- 
ner à des modèles linéaires. Cependant, pour certaines spécifications de modèle 
il s’avère impossible, même sous certaines hypothèses, d’utiliser les MCO. 
Nous allons présenter, très succinctement?, les méthodes d’estimation non 
linéaires en essayant d’en montrer l’inspiration générale et les limites. Des 
exemples d’utilisation sont présentés, ensuite, à partir des logiciels RATS et 
Eviews. 


nitiation aux méthodes d'estimation non linéaires 


L’inspiration générale des techniques d’estimation non linéaires sont les mêmes 
quel que soit le type d’algorithme. Il s’agit de méthodes itératives dans les- 
quelles l’équation non linéaire est linéarisée à l’aide d’un développement limité 
de Taylor (à partir d’un jeu de valeurs de coefficients initiaux). Les MCO sont 
alors utilisés sur cette équation linéaire afin d’estimer des nouveaux coefficients. 
Ces nouveaux coefficients permettent, à l’aide d’un nouveau développement 
limité, de procéder à une nouvelle linéarisation. La procédure est arrêtée lorsque 
les coefficients sont relativement stables d’une itération à l’autre. 


Pour ce type de méthode soit efficiente, il convient que les valeurs initiales 
ne soient pas trop éloignées des valeurs optimales. Dans le cas contraire, il n’y 
a pas convergence et la procédure est défaillante. 


1. Pour un approfondissement des modèles de diffusion cf. Bourbonnais R. et Usunier J. C. 
Chapitre 7, (2013). 
2. Pour un développement très complet, le lecteur peut se référer à Greene W.H., chapitre 10, 2000. 
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Algorithme de Gauss-Newton 


Soit le modèle non linéaire : y, = f(X, a) +6, où X est la matrice des observa- 
tions des variables explicatives (de dimension n, k + 1) et a est le vecteur (de 
dimension k + 1) des paramètres à estimer. 


Sous les hypothèses classiques concernant &,, l’estimateur des moindres car- 
rés est la valeur de a qui minimise la somme des carrés des résidus : 


S(a)=e'e = Ty; — f(X, a)ÏTy, — f(X, a)] 


Nous avons k + 1 conditions du premier ordre (9S/4a = 0), soit : 


28 __, af(X. a) 


[y — f(X, a)] = 0 


da da 
0& . 04 
Avec ee 3) = Z(a) = 3 5 : 
® df(&,, a) df(&,, a) 
0& Cu dy 


Soit Z(a!') cette matrice calculée pour les valeurs particulières de a(a = a'). 
Puis, à l’aide d’un développement limité de Taylor au voisinage de a', nous pou- 


vons approximer la r-ième observation 
| (a — a) 
a=al 
Ou encore, en notation matricielle : 
FX a) FX, a) +Z(a')(a — a) 
Soit y= f(X, a!)+Z(a')(a —-a!)+e 


Of (x, a) 


44 


Of (x, a) 


04 


FC, a) Z fx, a!) + | 


a=al 


ou encore : y= f(X, a!) +Z(a')a — Z(a')a! +e 
En posant y(a') = y — f(X, a!) + Z(a!')a', nous pouvons alors construire un 
pseudo-modèle linéaire qui est égal à : 
Fa!) = Z(a')a +8 
L’estimateur des MCO de ce modèle linéaire est donné par : 
a =[Z@)Z(@')T'Z(a') ya") 
=a'+[Z@')Z(@')T"'Z(@a')Ty — f(X, a] 
Ce qui donne k + 1 nouvelles valeurs pour le vecteur a = a?. Le processus 


est arrêté à la p -ième itération, lorsque nous observons une relative stabilité des 
coefficients ainsi estimés : & = a? © a”|. 
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Cette méthode assez complexe connaît quelque raffinement par l’utilisation 
d’un développement limité de Taylor du second ordre (algorithme de Newton- 
Raphson). 


Les logiciels d’économétrie (Eviews, RATS, ...) ainsi que les tableurs — à 
l’aide de la fonction SOLVEUR -— permettent, très simplement, d’utiliser ces 
méthodes d’estimation des modèles non linéaires. 


Néanmoins, il convient d’insister sur le fait qu’elles ne sont efficientes que si 


nous sommes capables de fournir des valeurs initiales compatibles avec la spé- 
cification du modèle et les données. 


xemples d'application 


Exercice n° 2 


+, fichier CGEX2 


Estimation des paramètres d’un modèle de diffusion Logistique 
et de Gompertz 


Le tableau 3 présente les ventes cumulées (en milliers d’unités) d’un CD audio d’un 
artiste à succès sur 19 semaines. 


Tableau 3 — Extrait des ventes cumulées sur 19 semaines (milliers d'unités) 


Semaines Ventes 
1 44,7 
2 61,0 
18 607,0 
19 633,9 


On demande : 

1) D’estimer les paramètres d’un modèle de diffusion de type Logistique. 
2) D’estimer les paramètres d’un modèle de diffusion de type Gompertz. 
Solution 


Le graphique 2 présente l’évolution des ventes cumulées en fonction des semaines. Ce 
graphique peut suggérer une évolution selon un modèle de diffusion, nous serions alors 
à proximité du point d’inflexion. 
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Graphique 2 — Ventes cumulées 


1) Estimation d’un modèle de diffusion de type Logistique (Eviews). 
Valeurs initiales compatibles 

PARAM 1 600. 2 5.3 0.5 

equation NLS ventes=C(1}/(1+c(2)*c(3) @trend) 


Résultats (Eviews) : 


Dependent Variable: VENTES 


Sample: 1 19 


Included observations: 19 


Convergence achieved after 8 iterations 


VENTES=C(1)/(1+C(2)*C(3)TEND) 


Coefficient | Std. Error | t-Statistic Prob. 
CA) 718.0033 | 11.87762 | 60.45008 | 0.0000 
Ce) 14.77212 | 0.536144 | 27.55254 | 0.0000 
C(3) 0.784909 | 0.004580 | 171.3614 | 0.0000 


R-squared 0.999009 


N CP 2 Ymax 718 
Le modèle estimé s’écrit : y, = : 
1+br  1+14,77 x 0,785! 


2) Estimation d’un modèle de diffusion de type Gompertz (RATS). 


* Régression non linéaire 


nonlinbra < Définition des paramètres à estimer 
frml gompertz = exp(b*r**(t)+a)  < Formulation du modèle 
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*Initialisation des paramètres 

eval a = 5. 

eval b = -3.5 

eval r = 0.5 

nlls(frml=gompertz.trace) taux <— Estimation des coefficients 


Résultats 


ca_-iocs Takur: 1ë 
o Shsirrvèlicas 19 Doyiéss ol Fréeacr. Lo 


é 2*e2 0.999556 A bas #2 9,939352 
Jicui-uicd ET#2 ù,929531 T'.x "#2 15.001 
arixh re CeCHCT SLd Erre: T-Stet ÊigriT 
Arnirriirsiérkhhéshieshrhiomhémirhitekhe arte ak e thé re kr ARmtRemRRrRRr ARR TAR NE 
1. -3.264637764 0.512313%52 -3355,93385 0,cÿoliosu 
I. BR .883723997 ù,501737150 126%.11145 0.C00C59:0 
5. 7 6.ÿ322581l14 0.70€44179 1111235637 ,CCGcancg 


Soit le modèle : y, = ebr'+a — e(73,46x0,88+6,83) . le seuil de saturation, selon un 
modèle de Gompertz, est donc de ef-55 — 927. 


Exercice n° 3 


LŸ, fichier C6EX1 


Estimation des paramètres d’une fonction de production de type CES 


Les fonctions de production à l’élasticité de substitution constante, appelées CES! 
(Constant Elasticity of Substitution), sont de la forme : 


Q = BilB> K°° + (1 — B) LFIP* avec B; et Ba < 0 
où 1/(1 — B;) représente l’élasticité de substitution?. 
Nous pouvons aussi l’écrire de la manière suivante : 
Q = BilB& K°° + (1 — 8)] LT 


où v représente alors les rendements d’échelle. 


En reprenant les données du tableau 1, on demande : 


1. La fonction de production à l’élasticité de substitution constante (CES) a été introduite par 
Arrow K.J. et al., 1961. 


2. L’élasticité de substitution mesure l’incidence de la variation relative des prix des facteurs sur la 
combinaison productive (le rapport K/L). 
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1) de transformer cette fonction de production par un passage aux logarithmes ; 
2) d’estimer les paramètres du modèle ; 


3) de comparer les résultats avec ceux obtenus à l’exercice 1. 


Solution 


1) Transformation du modèle 
Q = BilB> K°° + (1 — B2)] LP" 


Log(Q) = Log(Bi) + Ba Log LB KŸ° + (1 — Bi) L?] 


Nous observons que cette fonction de production n’est pas linéarisable (contraire- 
ment à la fonction de production de type Cobb-Douglas). Il convient donc d’utiliser une 
technique d’estimation des modèles non linéaires. 


2) Estimation des paramètres 


Les instructions du logiciel Eviews sont les suivantes : 


PARAM 1 12.2 -1.3 0.5 4 -0.5 < Initialisation des 4 paramètres 
NLS Q = C(1)*(C(3)*KC(4)}+(1-C(3))*LAC(4)) C2) < Équation 
Résultats 


ALS ## Dependent Variable îs 0 

SPL range: 1 - 25 

Humbor of ébuervallons: 75 

Q=C(1}FÉC (3 #K"C(A)+(1.-C(3))*L C4)" C2) 
Convergcnce achlaved efler 13 ilkerntione 


EEE SL ER ES SEE LÉ re 
COEFFICIENT STD. £ERROR T-STAT 2-TAIL SIC 
SSSR RS = ME 
C{1] 11.213534 1.427 0860 7.897919 G, 0000 
Cia} 0. 4049360 9. 1444706 ë. B883994 Ê.q10 
Cia} 0, 302016 -1.976737a 0.061: 
Ui2]} 0. TER LA +. 8106021 D. 0845 
F-equared 0. 983721 Hean of dependent var 44, 58080 
Adjusted R-squarcd 0.473110 $. 1. of dependent var 24. 70448 
5-E,. ©[ regresslon Ë. 431158 Sam of squatul rusid 379. SS8Ë 
Leg likelihocd 81.431939 F-stuilelic 144. 2673 


urbin-Hakson stat 2,555634 Ersbit-gtatistle] ©. 09000 


La fonction de production estimée s’écrit : 
Q = BilB KP + (1 — 8) LFT* 
= 11,21 [0,404 K 7957 40,594 LOST US 


3) Comparaison des résultats entre une fonction de production Cobb-Douglas et une 
fonction de production de type CES 


Lors de l’exercice 1, nous avons estimé les rendements d’échelle de la fonction 
Cobb-Douglas (@, + @ = 0,89) qui sont significativement décroissants. 


Pour la fonction de type CES, nous avons : 
D = , x Pi = —1,38 x —0,597 — 0,82 < 1 


Les rendements d’échelle sont décroissants, et l’élasticité de substitution constante 
est égale à : : 
1/(1— B5) = 0,42 
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es modèles 
à décalages temporels 


usqu'à maintenant, nous avons spécifié des modèles où toutes les 
variables sont exprimées à la même période. Cependant, la théorie 
économique postule couramment — non pas des effets synchrones — 
mais des effets retardés. 
Ces modèles à décalages peuvent inclure comme variables retardées aussi 
bien la variable endogène que les variables exogènes. Nous étudierons, 
tout d'abord en I. les modèles autorégressifs dont la variable retardée 
est la variable endogène. Puis, en II. une autre classe de modèle est envi- 
sagée : les modèles à retards échelonnés. Dans cette spécification, les 
variables exogènes apparaissent à plusieurs décalages. 
Enfin, en III, nous présentons deux exemples de modèles dynamiques. 


es modèles linéaires autorégressifs 


ormulation générale 


Dans ce type de modèles temporels, la variable endogène y, dépend : 


— de k variables exogènes x,,, x, ..., x, à l’époque r ; 
— des valeurs que prend la variable y, pendant les périodes précédentes, 
Vi-1s Vi2s ee, Vin. 


Soit la formulation : 


Y = bip ot... + bi} + do + Qixi + GX +... + xx + 8 


ou encore : y, = b; y,- 
» i re ÉrD&+ 1 u 


Les modèles à décalages temporels e 177 


Dans ce modèle, l'hypothèse HS, d'indépendance entre les variables expli- 
catives et l’erreur, n’est plus satisfaite car les variables y,_,, y,_,..., y,_, qui 
dépendent de &,_1, €; 2, ..., & , Sont aléatoires puisque y... est fonction de y, 
qui dépend de &,, soit : E(y:11 8) 0. 


Nous remarquons que si les variables exogènes x; et les erreurs &, sont 
fixées, les variables endogènes sont solutions de l’équation de récurrence : 


Ye = biyis + boy +... + bip +S, 
avec S, = Xa +&,. 


Il est démontré que la solution générale de cette équation de récurrence est 
explosive si une des A racines de son équation caractéristique! a son module 
supérieur à 1. 


Or nous devons considérer les processus explosifs — que ce soit d’une façon 
monotone ou oscillatoire — comme des phénomènes rares en économie (les 
variables sont limitées généralement dans leur croissance), c’est pourquoi il 
convient d’ajouter l’hypothèse de stabilité du processus. 


Cas particulier : le modèle autorégressif d’ordre 1 


Le modèle général spécifié ci-dessus est rarement utilisé, le plus souvent 
nous nous limitons à des processus autorégressifs d’ordre 12, de la forme : 


Ye = bDiÿi-i + do + &ixi + dXn +... + Gxy + & [1] 


Ce modèle est stable si |b,| < 1 et explosif si [bi| > 1. 


est d'autocorrélation et méthodes d'estimation 


La méthode d’estimation adéquate dépend d’une éventuelle dépendance des 
erreurs ; or, dans le cas d’un modèle autorégressif, le test de Durbin et Watson a 
une puissance réduite et est biaisé. C’est pourquoi il convient d’utiliser une autre 
statistique, celle du « h » de Durbin. 


1) Test d'autocorrélation des erreurs 


Dans le cas d’un modèle autorégressif d’ordre 1, le test classique de Durbin et 
Watson sous-estime le risque d’autocorrélation, un nouveau test d’autocorréla- 
tion des erreurs doit alors être utilisé?. La statistique utilisée est la suivante : 


1. L’équation caractéristique s’écrit 74 — bir"=! = brh2 =... — by, = 0. 
2. La variable y, dépend néanmoins des valeurs passées y,_1, ÿ,_2, ... Yo. 
3. Durbin J., 1970. 
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L n 
h=p TE [2] 
— no; 


avec D = 1 — dw/2 (dw est la statistique de Durbin et Watson calculée sur la 
modèle [1]) ; 
n = nombre d’observations ; 

2, 


CA , = variance estimée du coefficient b; à partir du modèle [1]. 


Cette statistique « h » est distribuée de manière asymptotique comme une 
variable normale centrée réduite. Aïnsi, il y a équivalence entre les deux tests 
d’hypothèses suivants : 


H0 : p —=0 H0 :h—=0 
H1:0420 H1:hZ0 


Si|h| < r°?, nous acceptons l’hypothèse HO d’indépendance des erreurs. 


(1? = valeur issue de la loi normale pour un test bilatéral au seuil de «.) 


Nous remarquons que si n6}, > 1, la statistique « h » ne peut pas être calcu- 
lée ; dans ce cas, nous pouvons utiliser la statistique de Durbin et Watson en 
incluant la zone de doute dans la zone d’autocorrélation des erreurs. 


2) Estimation si les erreurs ne sont pas corrélées 


Dans le cas d’absence d’autocorrélation des erreurs, les estimateurs des MCO 
appliqués au modèle [1] convergent asymptotiquement vers les valeurs vraies 
des paramètres et ont une variance minimale parmi tous les estimateurs conver- 
gents. 


Cependant, pour les petits échantillons, lors de l’estimation d’un modèle 
autorégressif d’ordre h, les résultats asymptotiques sont alors très approxima- 
tifs, car le nombre de périodes d’estimation est de n — h. De plus, les problèmes 
de colinéarité entre les variables explicatives décalées interdisent pratiquement 
d'utiliser les MCO. 


En résumé, pour l’estimation des modèles autorégressifs à erreurs indépen- 
dantes, l’application de la méthode classique des MCO est licite si le nombre 
d’observations est suffisant (souvent dans la pratique n > 15). 


3) Estimation en cas d'autocorrélation des erreurs 


Le modèle s’écrit alors : 
Ye = Diÿi1 + Go + diXi + GX +... + diXx + & [3] 


avec E = PE +U 
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Il s’agit d’un modèle à autocorrélation des erreurs, nous avons montré lors 
du chapitre 5 que la transformation en quasi-différences premières peut lever 
l’autocorrélation des erreurs d’ordre 1. 


Nous pouvons citer différentes méthodes d’estimation. 


a) Régression sur les différences premières 


On procède à deux régressions par la méthode des MCO : la première sur le 
modèle spécifié avec des variables non transformées et la seconde sur le modè- 
le spécifié avec des variables transformées en différences premières. 


S1 les deux résultats d’estimation sont proches, nous pouvons conclure que 
les paramètres du modèle sont suffisamment bien déterminés sans rechercher la 
liaison éventuelle des erreurs. 


b) Correction de l’autocorrélation des erreurs par régression sur les quasi- 
différences premières 


Par une des méthodes présentées au chapitre 5, nous procédons à la correction 
de l’autocorrélation des erreurs : estimation directe de po, Hildreth-Lu, 
Cochrane-Orcutt. 


c) D’autres méthodes 
Nous pouvons aussi citer : 


— la méthode des variables instrumentales (cf. chapitre 5), où nous retenons 
comme variable instrumentale la variable y;_ ; 
— la méthode du maximum de vraisemblance. 


La méthode des variables instrumentales résout le problème de convergence 
des estimateurs lorsque nous sommes en présence d’erreurs à moyenne mobile 
de type : 


Et = Ur — jus — Oous-2 — ... — Opus p 
Dans le cas d’erreurs autocorrélées, nous devons utiliser une des méthodes 


d’estimation robuste présentées au chapitre 5. 


4) Prévision dans un modèle autorégressif 


La prévision de la variable endogène y, à l'horizon h, est donnée par : 
Ynin = Dinan-i + Go + GiXintn + GrXonin + +2 + GrXtnth 


L'erreur qui affecte les valeurs successives de Ÿ,,,_, se cumule d’une pério- 
de sur l’autre, et ainsi la variance de l’erreur de prévision peut devenir très 
importante. 


L'utilisation à des fins de prévision du modèle autorégressif doit donc être 
limitée à quelques périodes. 
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Exercice n° 1 


LL, fichier C7EX1 


Estimation des paramètres d’un modèle autorégressif à erreurs liées 


Un économètre désire tester la relation entre les prix officiels (PO) de la tonne de 
café et les prix réellement appliqués à l’exportation (PE) par les pays producteurs. Il se 


propose d’estimer la relation : 


PO; = à + a PO; +a PE; +e 


dans laquelle le prix officiel est fonction de manière instantanée du prix observé et s’ajus- 


te avec un retard d’un an au prix officiel. 


Il dispose des données, sur 16 ans, présentées au tableau 1. 


Tableau 1 — Prix officiel et prix pratiqué 


à l'exportation de la tonne de café (en dollars) 


t PO PE 

1 455,0 615,0 
2 500,0 665,0 
3 555,0 725,0 
4 611,0 795,0 
5 672,0 870,0 
6 748,5 970,0 
7 846,0 1 095,0 
8 954,5 1 235,0 
9 1 090,0 1 415,0 
10 1 243,5 1 615,0 
11 1 390,0 1 795,0 
12 1 559,0 2 015,0 
13 1 781,0 2 315,0 
14 2 046,5 2 660,0 
15 2 311,0 2 990,0 
16 2 551,0 3 280,0 


On demande : 


1) d’estimer la relation et de tester une éventuelle autocorrélation des erreurs ; 


2) d’en corriger les effets, le cas échéant. 
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Solution 


1) Les résultats de l’estimation sont les suivants : 


Dependent Variable : PO 
Included observations : 15 after adjusting endpoints 


Variable Coefficient Std. Error  t-Statistic Prob. 
C —7.078673 1.851077 —3.824084 0.0024 
PO(-1) 0.224016 0.037090 6.039727 0.0001 
PE 0.622340 0.025520  24.38636 0.0000 
R-squared 0.999980 Mean dependent var 1257.267 
Adjusted R-squared 0.999976 S.D. dependent var 663.5723 
S.E. of regression 3.236240 Akaiïke info criterion 5.363558 
Sum squared resid 125.6790 Schwarz criterion 5.505168 
Log likelihood —37.22668 F-statistic 294296.0 
Durbin-Watson stat 0.625901 Prob(F-statistic) 0.000000 


L’équation est estimé sur 15 périodes (n — 1) car dans le modèle figure une variable 
retardée d’une période. 


La statistique de Durbin et Watson laisse augurer d’une autocorrélation des erreurs, 
ce qui est confirmé par le « h » de Durbin [2] : 


n 15 
h =D | —— = 0,687 |" — 3,68 > 1%S = 1,96 
PT n6Z 1— 15 x 0,0013 L 


Nous rejetons l’hypothèse HO, soit À Æ 0 — p 0. 
2) Nous allons tout d’abord comparer les estimations obtenues à partir du modèle brut à 
celles obtenues à partir du modèle en différences premières. 


Nous procédons à l’estimation du modèle en différences premières sur 14 ans car 
nous perdons de nouveau une observation lors du calcul des différences premières de 
PO;-1. 


Les résultats sont les suivants : 


Dependent Variable : D(PO) 


Included observations : 14 after adjusting endpoints 


Variable Coefficient Std. Error  t-Statistic Prob. 
C 2.891649 1.298314 2.227234 0.0478 
D(PO(-1)) 0.240680 0.024114 9.981022 0.0000 
D(PE) 0.598017 0.018553  32.23277 0.0000 
R-squared 0.999299 Mean dependent var 146.5000 
Adjusted R-squared 0.999172 S.D. dependent var 76.37030 
S.E. of regression 2.197504 Akaiïke info criterion 4.599930 
Sum squared resid 53.11925 Schwarz criterion 4.736871 
Log likelihood —29.19951 F-statistic 7845.105 
Durbin-Watson stat 1.781510 Prob(F-statistic) 0.000000 
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Nous observons que les différences entre les coefficients de régression sont assez 
faibles pour ai (0,224 et 0,240) comme pour a2 (0,622 et 0,598); nous pouvons consi- 
dérer les résultats obtenus à la première régression comme valides. 


Cependant, à titre pédagogique, nous allons utiliser la méthode de correction d’auto- 
corrélation des erreurs. 


Le modèle estimé, selon la méthode de Hildreth-Lu, est alors : 
PO; = —2,765 + 0,234 x PO,;_1 +0,6135 x PE; +e, 
(1,67) (15,5) (57,9) 
e = 0,418 e;_1 + v, 
R? =0,99; n=14; DW =2,08; (.) = t de Student 


Les prix officiels de la période f sont donc plus influencés par les prix réellement pra- 
tiqués en f que par les prix officiels de l’année précédente. 


es modèles à retards échelonnés 


ormulation générale 


Dans certaines spécifications de modèles économétriques temporels, nous pou- 
vons postuler que la variable endogène dépend des valeurs prises par une 
variable exogène à des époques antérieures, tel que : 


h 
Ye = Do + doX; + diXs-1 + Xs-2 +... + AnXi-n + E = Dax; +bo+e [6] 
j=0 
En général, l’effet de la variable explicative s’estompe avec le temps : 
dr >>... > dy 


Ce modèle [6] peut se simplifier dans son écriture en utilisant un opérateur 
décalage D défini par : Dx, = x,_, et en général : D'x, = x,.;, soit : 


h 


h ñ 
Yr — ÿ ax; + Do + €, = D + Do + €, = D] x + bo+E, 
i= i= 


j=0 
Mi — A(D)x; + bo + € [7] 
où A(D) est un polynôme de degré h, tel que : 
A(D) —= d + a D' + a D? + eu + a, D' 


Le nombre de retards, h, peut être fini ou infini. Cependant, la somme des 
coefficients a; tend vers une limite finie, sinon y, serait un processus explosif. 
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Le polynôme A(1)=a+a&+a+...+a, permet de mesurer, à long 
terme, l’impact de la modification de la variable explicative x, d’une quantité 
Ax sur la valeur de y. En effet, les coefficients a; représentent les multiplica- 
teurs instantanés et leur somme le multiplicateur cumulé. 


Retard moyen 


La notion de retard moyen permet d’appréhender le laps de temps qui corres- 
pond à la valeur moyenne des coefficients a,. Il est égal à la moyenne pondérée 
des coefficients, soit : 


h 


ja; , 
Dé - a +2@+...+ha, _ A) [8] 
> d+dä+d+...+a A(1) 
&: 
er 


L’estimation des paramètres du modèle [6] soulève deux types de difficultés : 


— en pratique, la valeur h qui mesure l’importance du nombre de retards est 
rarement connue, même si nous en connaissons l’ordre de grandeur ; 


— le second problème résulte de la colinéarité entre les variables exogènes 
décalées. En effet, lorsque le nombre de retards est important, la colinéari- 
té entre les variables explicatives décalées risque d’entraîner une impréci- 
sion dans l’estimation des coefficients. C’est pourquoi, le plus souvent, 
nous émettons des hypothèses sur la forme de retards. 


Ces deux points sont abordés ci-dessous. 


étermination du nombre de retards 


Lorsque la valeur h du nombre de retards du modèle [6] est inconnue, il existe 


des critères statistiques permettant de la déterminer!. 


1) Test de Fisher 


Le test le plus naturel est celui de Fisher dans lequel nous testons l’hypothèse de 
la nullité des coefficients de régression pour les retards supérieurs à h. 

La formulation des hypothèses est la suivante, lorsque l’on teste, d’une manière 
descendante, une valeur de h comprise entre 0 et M : 0 < h < M. 


1. Il s’agit de déterminer quelle est la période maximum d’influence de la série explicative. Il peut 
très bien arriver, c’est même souvent le cas, que des coefficients de rang inférieur au décalage 
h ne soit pas significativement différents de 0. 
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H0':h=M-—I1— ay =0 Hl':h=M — ay 20 
HO :h=M-2— ay =0 HP :h=M-I1 — ay #0 
H0':h=M—i— ay; =0 Hl':h=M-i+1 — ay in 20 


Chacune de ces hypothèses fait l’objet du classique test de Fisher, soit : 


 (SCRy-i — SCRy-iti)/1 


7 SCRy-iu/(n — M +i-—3) [1 


Fi 


que l’on compare au F lu dans la table à 1 et (n — M + i — 3) degrés! de liberté. 

Dès que, pour un seuil donné, le F empirique est supérieur au F lu, nous 
rejetons alors l’hypothèse HO’ et la procédure est terminée. La valeur du retard 
est égale àM—-i+1:h=M-i+l1. 

Afin de pouvoir procéder à ce test dans ses conditions d’application, la 
Somme des Carrés Totaux doit rester constante d’une estimation à l’autre. Cela 
oblige donc à estimer les différents modèles avec un nombre d’observations iden- 
tique correspondant donc au nombre d’observations réellement disponible pour 
le décalage le plus important, chaque décalage entraînant la perte d’une donnée. 


2) Critère de Akaike (AIC)? 


Une autre méthode consiste à retenir comme valeur de h celle qui minimise la 
fonction de Akaike qui est donnée par : 


SCR 2h 
AIC(h) = Ln( ) + — [10] 
n n 
avec SCR, = Sommes des Carrés des Résidus pour le modèle à h retards 


n — nombre d’observations disponible 
(chaque retard entraîne la perte d’une observation) 


Ln = logarithme népérien 


3) Critère de Schwarz (SC)? 


Enfin, une méthode très proche de la précédente consiste à retenir la valeur de 
h qui minimise la fonction de Schwarz : 


SC(h) =L(SE) Re, [11] 


n 


1. Le degré de liberté du dénominateur est égal au nombre d’observations (7) moins le nombre de 
paramètres à estimer dans le modèle [6]. Soit pour h = M — i + 1 et en tenant compte du terme 
constant et du coefficient de régression pour la variable x à O retard : 

n—(M-i+lD-1-1=n-M+i-3. 

2. Akaïke H., 1973 ; 1974. 

3. Schwarz G., 1978. 
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Exercice n° 2 
LŸ: fichier C7EX2 


Détermination du nombre de retards dans un modèle à retards 
échelonnés 

La théorie économique postule que les dépenses d’investissement (notées y,) peu- 
vent être expliquées par les profits passés (notés x,). Le modèle prend la forme d’un 
modèle à retards échelonnés tel le modèle [6]. 


Nous disposons d’un extrait des données trimestrielles du tableau 2 concernant l’in- 
dustrie chimique française. 


N'étant pas certains de la spécification exacte du modèle, nous désirons tout d’abord 
rechercher le nombre de décalages trimestriels qui semblent avoir un effet sur les 
dépenses d’investissement. Puis après avoir déterminé le nombre de retards, nous calcu- 
lerons le délai moyen. 


Tableau 2 — Dépenses d'investissement et profit 
(en millions d'euros) 


Trimestre Y X; 
1 2 072 1 660 
2 077 1 926 
43 2 840 3 449 
44 2 837 3 764 


Solution 


Nous procédons aux estimations des modèles sur 34 trimestres, puisque le décalage 
maximum testé est de 10, on élimine les 10 premières observations. 


Nous calculons les trois critères : Akaïke, Schwarz et Fisher à l’aide d’un program- 
me Eviews en téléchargement (C7EX2). 


Les résultats sont consignés dans le tableau 3. 


Tableau 3 — Résultats de la recherche du nombre de décalages optimal 


Décalage |  Akaiïke Schwarz | Fisher 
0 11,96 11,96 16,82 
1 11,50 11,54 18,91 
2 11,04 11,12 19,18 
3 10,55 10,68 10,89 
4 10,25 10,42 8,59 
5 9,99 10,21 6,86 
6 9,84 10,10 1,09 
7 9,88 10,19 0,13 
8 9,96 10,31 0,77 
9 10,03 10,43 0,25 

10 10,10 10,55 _ 
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Nous observons immédiatement que les minima des deux critères (AZC(h) et 
SC(h)) sont situés sur la ligne 6, correspondant donc à 6 décalages. La première valeur 
du Fisher empirique qui est significative — en partant du retard 10 — est celle de la ligne 
5. Elle est égale à 6,86, ce qui vient confirmer une influence de la variable explicative 
allant jusqu’à un décalage de 6 périodes. 

Nous allons détailler le calcul des critères! de Akaïke et Schwarz pour le retard 6. Le 
résultat de l’estimation pour 6 retards est le suivant : 


— Variable à expliquer : Y 


— n= 38 

Variable Coefficient Écart type t de Student Prob. 
C 501,5414 154,8486 3,238915 0,0029 
X — 0,011389 0,081532 — 0,139687 0,8898 
X(- 1) 0,061265 0,124906 0,490487 0,6274 
X(-2) 0,227569 0,119635 1,902194 0,0668 
X(-3) 0,167932 0,112997 1,486158 0,1477 
X(-4) 0,118734 0,127454 0,931580 0,3590 
X(—5) 0,000169 0,136907 0,001235 0,9990 
X(- 6) 0,237174 0,084065 2,821310 0,0084 
R2 = 0,92 0,921953 Somme des carrés des résidus =  521116,1 


D’après [10], nous avons : 


5211161 2x6 
AIC(6) = Ln Pre 
38 38 
Et d’après [11] : 
5211161 6 x Ln (38 
SC(6) = Ln 4 SC 
38 38 


Nous remarquons que la probabilité critique du coefficient de la variable X(-6) est 
largement inférieure à 0,05 ; le coefficient est donc significativement différent de 0. Ceci 
est évidement conforme aux résultats précédents. 


Les trois critères sont (heureusement) cohérents, le modèle à retards échelonnés com- 
porte 6 retards : l’investissement des entreprises de ce secteur est fonction des profits réa- 
lisés sur les six derniers trimestres, soit un an et demi. Il convient de noter que seul le 
coefficient du sixième retard est significativement différent de 0. 


Le graphique 1 illustre la structure de pondération des retards pour le modèle ainsi 
estimé. 


1. Nous ne revenons pas sur le test de Fisher qui a été déjà abondamment illustré. 
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Cofficiènts 


Retards 


Graphique 1 — Structure de la pondération des retards 


Le retard moyen est égal d’après [8] : 


6 
2 | 0,0612+2 x 0,227+ 3 x 0,168+ +6 x 0,237 
ü —0,011 + 0,227 + 0,168 +... + 0,237 


= 3,64 


Le délai moyen de réaction est 3,64 trimestres, soit presque une année. 


istribution finie des retards 


Considérant que nous avons déterminé la longueur des retards h, il convient 
d’estimer les coefficients a; du modèle. Cependant, l’utilisation des MCO peut 
se révéler impossible du fait de la multicolinéarité entre les variables explica- 
tives décalées. C’est pourquoi, dans ce contexte, nous allons présenter une 
méthode permettant, moyennant des hypothèses sur la forme des coefficients, de 
réduire le nombre de paramètres à estimer. 


Fonction polynomiale des retards (retards d’Almon|) 


Nous pouvons imaginer une infinité de formes concernant la distribution des 
coefficients a; (graphique 2). La méthode des retards d’Almon est très utilisée, 
car elle permet de dégager des profils de retards s’adaptant à des représentations 
différentes. 


1. AlmonS., 1965. 
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Cette technique consiste à imposer aux coefficients d’appartenir à un même 
polynôme de degré qg (graphique 3), tel que : 


q 
di = do + oi + oi +... +ai = Ni) [12] 
j=0 


Par exemple, pour un polynôme de degré 2 (q = 2), nous avons la séquence 
des coefficients : 


FAI & 1 0 O0 
di = o + di + A en 1 1 1 . 
ou encore = u œ 
& = do + 20, + da, d 1 2 2 
a D 2 
d3 = do + 301 + Ja 3 
a = H œ 


Î Î 


Graphique 2 — Exemples de structures de retards 


Nous pouvons généraliser la formule précédente pour h retards et un poly- 
nôme de degré q. 


Un 1 0 0 0 
di 1 1 > 1 (041 
a 1.2; 27° à 5.92 (22) 
a 258 Ds se rs [13] 
a 1h k . . h]la, 
(h +1,1) (A+1,qg+1) (+1,1) 
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— 


{a} degré 1 {b) degré £ 


{c) degré 3 


Graphique 3 - Exemples de retards polynomiaux 


Le modèle initial Y = Xa +e peut alors s’écrire Y = XHa+e=Za+e 
dans lequel X H = Z est la matrice des observations des « nouvelles » variables 
explicatives. 


L’estimation par la méthode des MCO des g+1 coefficients «, 


(Go, &,..., &,), permet d’obtenir, à partir des relations [12], les estimations des 
h +1 paramètres de a (&, ,..., @). 


Dans cette méthode, nous sommes confrontés à un double choix : 
— la valeur h du nombre de retards (nous avons la réponse, cf. 2), 
— le degré du polynôme. 


Le degré du polynôme gq, g < h, peut être déterminé à l’aide d’un test por- 
tant sur la significativité, par rapport à 0, du coefficient («,) de la dernière 
«nouvelle » variable explicative. En partant d’une valeur g = h — 1, on teste la 
significativité du coefficient « du terme le plus élevé à l’aide d’un # de Student 
et on réduit le degré du polynôme jusqu’à ce que ce coefficient soit significatif. 


Les logiciels d’économétrie traitant des estimateurs d’Almon offrent la pos- 
sibilité d’introduire des contraintes supplémentaires concernant les valeurs des 
coefficients a_, et/ou a,,, afin qu’elles soient nulles. Cela se justifie par le fait 
que a_, est le coefficient théorique de la variable x,,, qui est sans influence 
sur y. 
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Exercice n° 3 


LL, fichier C7EX2 


Estimation des coefficients à l’aide d’un polynôme 
(méthode d’Almon) 


En reprenant le modèle — Investissement/Profit — de l’exercice 2, on demande d’esti- 
mer les coefficients par la méthode des retards d’ Almon. 


Solution 


Le corrigé de cet exercice est réalisé à l’aide de Eviews, qui permet le recours direct 
à la technique du polynôme d’Almon. 
L’instruction est la suivante : LS Y C PDL (X, 6, 4, 1) 
PDL : Polynomial Distribued Lag 
X = série explicative 
h = 6 : nombre de décalages (résultat de l’exercice 2) ; 


q = 4 : degré du polynôme (après un essai avec g = 5, le coefficient de la variable 
PDLS n’est pas significativement différent de O), 

1 = indicateur de la contrainte : a_, — 0 (cet indicateur vaut O si l’on ne désire aucu- 
ne contrainte, 2 pour la contrainte a,,, = 0 et 3 pour les deux contraintes simultanées). 


Résultats 


Dependent Variable : Y 
Method: Least Squares 
Included observations : 38 after adjusting endpoints 


Variable Coefficient Std. Error  t-Statistic Prob. 
C 511.6833 143.4181 3.567774 0.0011 
PDLOI —0.193452 0.120131 -1.610334 0.1169 
PDLO2 0.215794 0.103537 2.084228 0.0450 
PDL03 —0.055823 0.025884 2.156616 0.0384 
PDLO4 0.004228 0.001956 2.160957 0.0381 
R-squared 0.921681 Mean dependent var 2567.553 
Adjusted R-squared 0.912187 S.D. dependent var 424.8027 
S.E. of regression 125.8826 Akaiïke info criterion 12.63066 
Sum squared resid 522932.5 Schwarz criterion 12.84613 
Log likelihood —234.9825 F-statistic 97.08789 
Durbin-Watson stat 0.583162 Prob(F-statistic) 0.000000 
Lug Dislribulion uf X Lug  Coef SE. T-Stat 


.CAis3 -0,69441 
.0IaTé 
.05741 
- 02940 
- 0462 
- 05536 
- 06984 
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Les coefficients du polynôme (æ;) sont représentés par les variables PDLi, ils sont 
(presque) tous significativement différents de 0. La présence d’une contrainte entraîne la 
perte d’un degré de polynôme. 


Le calcul des coefficients et la structure de pondération apparaissent directement 
après, les coefficients (a;) sont tous significativement différents de 0, sauf ceux des 
variables x, et x;_s. 


Le graphique 4 présente les coefficients calculés lors de l’exercice 2 et les coeffi- 
cients ajustés à l’aide du polynôme estimé. 


0.24 
0.23 — 

C2 — 
0.18 — 
0.16 — 


Q. 14 — 


E* 
a. 1 — \, 
O.0E —| " Coeff, non contraint 


Cæfficlants 


0.0E 
ÿ.04 
9.08 
ê 

- 0.02 
- 0.04 


Aetards 


Graphique 4 — Ajustement des coefficients à l’aide d’un polynôme de degrés 4 


istribution infinie des retards 


Dans ce type de modèle, l’effet de la variable exogène n’est plus limité dans le 
temps, mais a un effet illimité, bien que, naturellement, cet effet s’estompe pour 
les périodes anciennes. 


Y = dax, + bo + €, = Sans + bo +e, = D x, + bo + 8,[14] 
j=0 j=0 j=0 


Afin de se ramener à un nombre fini de paramètres à estimer, nous devons 
postuler une forme particulière que peut prendre la succession des coefficients 
do,di,d2.….. 


Nous pouvons admettre plusieurs types de spécifications, deux modèles par- 
ticuliers — les plus utilisés — font l’objet d’une présentation : 
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— une décroissance géométrique des effets de la variable exogène avec le 
temps ; 


— une croissance suivie d’une décroissance. 


1) Modèle de Koyck (progression géométrique) 


Le modèle de Koyck! postule une décroissance géométrique de la structure des 
retards (graphique 5) telle que, dans le modèle [14], les coefficients soient liés 
de la manière suivante : 


& = À 
& = 4 
et en général a; = La avec 0 < À < 1 
Soit 
= bo + 40%, + Adox 1 + La, +... + Max; +... +8, 
ou encore : 
Y = bo + dx, + x + Lx, 0 +... + Aix; +..)+8, 


ä; 


Graphique 5 - Modèle de Koyck : 
les coefficients suivent une progression géométrique 


La fonction A(D) associée est alors : 
A(D) = ao + AayD' + ay D? +... 
Le modèle y, = A(D)x, + b, + 8, peut alors s’écrire : 
B(D)y, = B(D)A(D)x, + B(D)bo + B(D)e, avec B(D) = A(D) !. 
Or A(D) = a(1 + 1D'+ XD? +...) = al — AD)! 


(somme d’une progression géométrique), nous avons donc B(D) = (1 — ÀD)/«. 


1. Koyck L. M. 1954. 
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Soit (1 —AD)y, = aox, + (1 — À)b5 + (1 — A D})e, ou encore : 
Ye — À + doxs + (1 — À)bo + 8; — À, [15] 


qui est un modèle autorégressif à erreurs liées dont la procédure d’estimation a 
été exposée en I. 


Cette transformation — qui consiste à passer d’un modèle à retards échelon- 
nés à un modèle autorégressif — est habituellement appelée « transformation de 
Koyck ». Nous pouvons noter que nous passons d’un modèle à retards échelon- 
nés, difficile à estimer par l’abondance des paramètres, à un modèle autorégres- 
sif, simple dans sa spécification. 


2) Modèle de Solow! (distribution de Pascal) 


Les coefficients sont distribués selon : 
a; = (1—2)*'C',;\ où C},, est le coefficient du binôme de Newton, r et À 
sont deux paramètres avec 0 <1<letreN. 

Pour r = 0, nous retrouvons la distribution géométrique de Koyck, le gra- 
phique 6 illustre la distribution des coefficients des retards. 


j 


Graphique 6 — Distribution de Pascal des coefficients pour différentes valeurs de r 


Le modèle général s’écrit : 


= bo + > — 1) T1C'. dx, +e, ou encore 


r+i 
i=0 
Vr — A(D)x, + bo + 8, [16] 
Une démonstration analogue à la précédente permet d’écrire le modèle [16] 


B(D)y, = B(D)A(D)x, + B(D)b + B(D)e, avec B(D) = A(D)°! 


1. Solow R., 1960. 
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avec : 
— pour r =0 —> B(D) = (1 — ÀD)/&, soit le modèle précédent 
— pour r =1— B(D)=(1-1D)/& 


Soit : 
Yr = 2À y; = M Yr-2 + doXs + ( — 2À + )bo + v; [17] 


avec v, = (1 — 2AD + 2D°)6, = 8, — 2he,_, + Ve, 
— pour r=2— B(D)=(1-21D)/& 
Soit : 
M = 3y, — 32y, 2 + My 3 + a0x, + (1 —3à +322 —X)b+u, [18] 


avec v, = (1 — 3AD + 342D? — XD°)e, = €, — 3e, + 3426, — Xe, 


Afin de déterminer les valeurs du paramètre r, Maddala et Rao (1971) sug- 
gèrent l’utilisation d’une procédure de balayage dont la fonction objectif à maxi- 
miser est le coefficient de détermination corrigé (KR ) 


Exercice n° 4 
LJ, fichier C7EX2 


Estimation des coefficients d’un modèle selon une spécification 
des retards de Koyck et une distribution de Pascal 


Nous reprenons les données du tableau 2 concernant la relation Investissement/Profit, 
on demande : 


1) d’estimer les paramètres du modèle si on suppose que les coefficients suivent une 
spécification de Koyck ; 


2) de rechercher l’ordre d’une distribution de Pascal et d’estimer les paramètres du 
modèle pour l’ordre adéquat ; 


3) de comparer les résultats obtenus par les différentes méthodes employées lors des 
exercices 2, 3 et 4 ; 


4) enfin, de calculer l’élasticité de long terme des dépenses d’investissement au 
profit. 


Solution 


1) On suppose que les coefficients du modèle à retards échelonnés suivent une progres- 
sion géométrique. D’après [15], l’estimation des paramètres du modèle s’effectue sous la 
forme d’un modèle autorégressif à autocorrélation des erreurs. 


Les résultats de l’estimation du modèle sont les suivants : 
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Y = —222,23 + 0,907y,_; +0,179x, +e, 
(—2,10) (25,24) (7,59) 


n —= 43 

R? = 0,95 

() = 1 de Student 
DW = 0,97 


Nous avons utilisé directement la méthode des MCO), car la méthode de correction 
d’autocorrélation des erreurs envisagées en I donne des résultats quasiment identiques. 


Nous obtenons : 
À = 0,907 ; & = 0,179 ; Bb, = —222,23/(1 — 0,907) = —2 400,23 
Le modèle peut donc s’écrire : 
y = —2400,23 + 0,179 x, + 0,907 x 0,179 x,_1 + 0,907? x 0,179x,-2 +...+e 
ou encore : y; = 0,907 y;_1 + 0,179x, — 222,23 +e, 


2) Nous supposons maintenant que les coefficients suivent une distribution de Pascal. 


Y = 40,78 + 1,42y;_1 — 0,54y,_> + 0,096x, + e, 
(0,40) (13,59) (—5,10) (3,83) 


n = 42 

R? = 0,97 

() —= 1 de Student 
DW = 2,22 


Il s’agit donc d’estimer des modèles autorégressifs d’ordre 1, 2, 3, etc. Afin de déter- 
miner l’ordre, nous avons procédé à toutes les estimations de ces modèles. À partir d’un 
modèle autorégressif d’ordre 3, les coefficients ne sont plus significativement différents 


de 0. Le modèle autorégressif d’ordre 1 ayant déjà été estimé, nous avons procédé à l’es- 
timation du modèle d’ordre 2. 


D’après [17], nous obtenons en procédant par identification : 


>) 


= 0,541 = 1,426/2 = 0,72 ; & — 0,096 ; 
bo = 40,78/(1 — 2À + A2) — 40,78/0,0784 — 520,15 


Le modèle estimé est alors : 
Ye = 1,426 ÿ;_1 — 0,541 y;_2 + 0,096 x, + 40,78 + e, 
i=00 


ou encore : y, = 520,15 + ja — 0 PC 


i=0 


0,72!x,_; +e, 


Î 
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3) Comparaison des méthodes 


Nous pouvons construire le tableau 4 dans lequel nous indiquons les valeurs des 
coefficients associées à chaque retard (limités à 6 pour les modèles à retards infinis), la 
somme des retards et le délai moyen, ceci pour les quatre méthodes employées. 


Tableau 4 - Comparaison des méthodes de calcul des coefficients 


Retard Non Almon Koyck Pascal 
i contraint! qg=4 r=l 

0 —0,01138 | —0,0292 0,1795 0,0784 

1 0,06126 0,09733 0,1623 0,0169 

2 0,22756 0,19701 0,1472 0,2438 

3 0,16793 0,18851 0,1335 0,2926 

4 0,11893 0,0920 0,1211 0,3160 

5 0,00016 0,02912 0,1098 0,3185 

6 0,23717 0,22298 0,0996 0,3058 
Somme 0,0814 0,7977 0,9530 1,7246 
Délai moyen 3,6421 3,6459 2,1026 3,6104 


À la lecture de ces résultats, nous constatons la diversité des profils des coefficients 
estimés. En effet, nous avons tenté, à des fins pédagogiques, de faire correspondre les 
coefficients à des structures bien déterminées qui représentent des spécifications de 
modèles différentes les unes des autres. Dans la pratique, cette démarche est absurde car 
il convient de tester une seule forme de spécification : 


— soit celle que la réflexion économique nous conduit à retenir ; 
— soit celle dont le profil du modèle non contraint semble la plus proche. 
4) Calcul de l’élasticité de long terme des dépenses d’investissement au profit. 


En considérant le modèle à distribution géométrique des retards où la variable exo- 
gène et la variable endogène sont sous forme logarithmique : 


Log y, = bo + ao Log x, + AaoLog x;-1 + X2& Log x;-2 +...+8 
Le modèle, sous forme réduite, s’exprime par : 


Log y, — À Log y;_1 + ao Log x, + co + v, 
L'élasticité de long terme est égal à? : eyr = ap/(1 — À), l’élasticité de court terme 
est donnée par : ecr = ao, et le paramètre d’ajustement est À. 


L’estimation du modèle Dépenses d’Investissement/Profit sous forme logarithmique 
conduit aux résultats suivants : 


1. Modèle non contraint = estimation libre des coefficients. 


2. L’élasticité de long terme est la somme des élasticités (les coefficients) aux différents décalages, 


soit une somme d’une progression géométrique de premier terme ao et de raison À. 
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Log y, = 0,904 Log y:_1 + 0,184 Log x; — 0,699 + v, 
(27,3) (8,48) (2,36) 
n =43 
R? = 0,95 
(-) = 1 de Student 
Soit : er = ào/(1 D = 0,184/(1 — 0,904) = 1,91. 


L’élasticité de long terme est donc égale à 1,91, nous sommes dans la zone des ren- 
dements croissants. Lorsque le profit augmente par exemple de 10 %, l'investissement à 
long terme augmente de 19,1 %. 


eux exemples de modèles dynamiques 


Les exemples d’application des modèles à décalages sont très nombreux dans la 
littérature. Nous allons en présenter deux particulièrement intéressants. 


e modèle d'ajustement partiel 


Le plus souvent, en économie, la rigidité des institutions ou des structures 
empêche les variables à expliquer d’atteindre le niveau désiré en une seule pério- 
de. Examinons deux exemples : 


- Afin de faire face à une augmentation de la demande, une entreprise cherche à 
se doter de moyens de production supplémentaires. Cependant cet investisse- 
ment ne peut pas être réalisé immédiatement et demande un certain temps 
d’ajustement. 


* Lors de l’augmentation des prix du pétrole, les consommateurs et les institu- 
tions réagissent avec retard à cette modification des prix. Il en résulte qu’à 
court terme le comportement des consommateurs ne reflète pas l’ajustement 
qui s’est produit à long terme. 


La formulation de ce modèle est la suivante : 


il est nécessaire de distinguer entre la valeur désirée, de la variable à expli- 
quer (y?) , et la valeur vraie de cette même variable (y,). Le niveau désiré de la 
variable à expliquer est fonction de la variable explicative x, tel que : 


y? = do + dix, + E, [19] 
Une modification de la valeur de x, entraîne une modification de la valeur 


désirée de la variable à expliquer. Cependant, malgré une spécification simple, 
nous ne pouvons pas appliquer les MCO puisque nous n’avons aucune mesure 
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de y’. En revanche, nous connaissons les valeurs de y, et nous pouvons spéci- 
fier une relation entre y? et y, : 


Ve — Yi = AGP — y) avec O0 <A<1 [20] 


À est appelé le coefficient d’ajustement. 


La relation [20] représente l’ajustement progressif qui s’opère entre la valeur 
désirée et la valeur observée. 


Ce modèle peut se ramener de manière simple à un modèle de Koyck. 
En substituant l’équation [19] dans [20], on obtient : 
Yi — Yi = À(Qo + Aix, + €, — y) ou encore 


21 
Ye — (1 — À)y_i + Ado + ÀG:x, + LE, , 


M = biy1 + © + cix, + v, dont on peut estimer les paramètres par la méthode 
des MCO, avec b; = (1—À) ; cc =XC; C1 =À&. 


e modèle d'anticipations adaptatives 


Dans cette spécification, les valeurs de la variable à expliquer y, sont fonctions 
des valeurs, non pas observées d’une variable explicative, mais des valeurs 
attendues, telles que : 

Ye = do + ax} + & [22] 
où x} est la valeur prévue de la variable explicative x.. 


Par exemple, la production d’une entreprise est fonction des valeurs prévues 
des ventes. 


Comme pour le modèle précédent, nous sommes confrontés à l’absence de 
mesure de la variable x}. Pour lever cette difficulté, nous devons poser une 
hypothèse concernant la formation de la variable x} : celle des anticipations 
adaptatives. 


Cette relation s’écrit : 
x? —x/ =A(x —-x},) avecO<AK<Il [23] 


où À est le coefficient d’anticipation. 


Nous remarquons que si À = 0, l’anticipation reste constante quelles que 
soient les réalisations de x;, le modèle ne réagit pas aux nouvelles valeurs réali- 
sées. Si À = 1, au contraire, les valeurs anticipées sont toujours égales aux 
valeurs courantes. Dans la pratique, ce coefficient est donc compris entre ces 
deux valeurs en fonction du degré de réactivité de l’anticipation. 

L’équation [23] peut aussi s’écrire : 


x? = x, + (1 — A)x}, en développant cette formule il vient : 
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XP = x, + À — Axes + AG — A )x, 2 + A — A)$x, 3 +. 
x? = Sa — À)'x, ; [24] 
i=0 
En remplaçant x}? par son expression dans [22] : 
Yr — do + diÀ S u 1)'x à + €, 
i=0 


qui est un modèle à retards échelonnées! dont une transformation de Koyck per- 
met de mettre sous une forme autorégressive : 


Y = Àao + ax, + (1 — À)3 1 + [es — (À — À)e 1] 
Nous pouvons estimer ce modèle autorégressif à autocorrélation des erreurs, 
et ainsi, en déduire une estimation des paramètres À, &, &. 


Il est à noter que ces deux modèles peuvent être combinés, bien qu’alors 
cette spécification semble un peu abondante et d’interprétation délicate. 


Exercice n° 5 


LL fichier C7EX2 


Estimation d’un modèle d’ajustement partiel 
et d’anticipations adaptatives 


À partir des données du tableau 2, on désire estimer les paramètres d’un modèle 
d’ajustement partiel et les paramètres d’un modèle d’anticipations adaptatives. 
Solution 


Nous estimons le modèle autorégressif d’ordre 1 avec autocorrélation des erreurs 
(méthode Hildreth-Lu) : 


Yr = —103,07 + 0,882 X y;_1 + 0,1555 x x; +e, 
(0,47) (11,04) (4,41) 
e; = 0,5489 e,_; + v, 


R? = 0,96 ; n = 42 ; DW = 1,83 ; (-) = t de Student 


Soit: À=1— 0,882 — 0,1178 ; do — —103,07/0,1178 & —874,9 ; 
& = 0,1555/0,1178 & 1,32 


— Modèle d’ajustement partiel : 
y = -874,9+1,32x; +e, et y — y_1 = 0,118(y? — y; 1) 
— Modèle d’anticipations adaptatives : 
= —874,9+1,32x/ +e, et x? — x, —0,118(x —x?,) 
1. Nous remarquons que la valeur de la variable à expliquer y dépend d’une pondération géomé- 


triquement décroissante de la variable explicative x. Cette structure de pondération est le fon- 
dement de la méthode de prévision appelée « lissage exponentiel ». 
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Exercice n° 6 


Modélisation du prix d’une matière première 


Nous nous intéressons à modéliser l’évolution du prix d’une matière première y 
selon un modèle autorégressif d’ordre 1 et une variable exogène x, — la demande — à par- 
tir d’une équation de la forme : y, = 41y;-1 + ax, + €, [El] avec &, répondant aux 
hypothèses classiques. Les données ont été préalablement centrées sur leur moyenne. 


L’estimation de l’équation [E1] sur 22 périodes donne : 


M = 0,757; 1 + 0,256%x, +e, [E2] 
(0,025) (0,02) 


R? = 0,996 ; DW = 2,17 ; n = 22 ; (.) = écart type 
1) Le coefficient de détermination a-t-il une signification dans cette équation ? 
2) Le coefficient a, est-il significativement différent de zéro ? 
3) Les erreurs du modèle sont-elles autocorrélées à l’ordre 1 ? 


4) Quel est, à long terme, l’influence d’une augmentation de la demande x, de 1 unité 
sur le prix y, ? 


5) En effectuant une nouvelle régression de y, sur y,_\ seule, on obtient : 


= 0,615y;_: +e [E3] 
(0,044) 


R2 = 0,981 ; DW= 1.64 ; n = 22 


Est-il normal ou fortuit que le R? soit plus élevé dans l’équation [E2] que dans 
l'équation [E3] ? 


6) En ôtant la variable x, dans la régression [E3] le coefficient de y,_, a été modifié, 
pourquoi ? 


7) Que signifierait un modèle du type y, = ay;-1 + €, dans lequel a serait supérieur à 1 ? 


8) L’estimation selon une même spécification mais pour une autre matière première 
donne : 


Y = 0,695 y.-1 + 0,336x, +e, [E4] 
(0,053) (0,046) 


R2 = 0,984 ; DW = 2,27 ; n = 22 
Les coefficients a, sont-ils significativement différents entre la régression [E2] avec 
ceux de l’équation [E4] ? 


Solution 


1) Bien que le modèle ne possède pas de terme constant, le R? peut s’interpréter car les 
données ont été préalablement centrées sur leurs moyennes. 
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2) Le coefficient a, est significativement différent de zéro car É = 0,256/0,02 = 12,8 > 
15 = 2,09. 

3) Nous sommes dans les conditions d’application de la statistique de Durbin et Watson 
car bien que le modèle ne possède pas de terme constant, le DW peut s’interpréter car 
les données ont été préalablement centrées. Mais il existe un biais de sous-estimation dû 
au modèle autorégressif. [1 faut calculer le h de Durbin : 


DW 
h = p detre es 


1—n6? 

äl 
n = nombre d’observations 
6 . = variance estimée du coefficient 4, de la variable décalée 


Cette statistique h est distribuée de manière asymptotique comme une variable nor- 
male centrée réduite. Ainsi, il y a équivalence entre les deux tests d’hypothèses suivants : 


H0 : p=0 H0 :h=0 
H1:p0Z40 H1:hZ0 


Si lAl < 1%’? nous acceptons l’hypothèse HO d’indépendance des erreurs. 


(4% — 1,96 valeur issue de la loi normale pour un test bilatéral au seuil de 5%). 
1h| = —0,085 LE = 0,40 < 19% — 1,96, nous acceptons l’hypo- 
? 1 —22 x 0,025? ’ PU 


thèse d’indépendance des erreurs. 

4) À la période 1 : Ay, = 0,757Ay;-1 + 0,256Ax, = 0,757 x 0 + 0,256 x 1 = 0,256 
À la période 2 : Ay, = 0,757 x 0,256 = 0,194 
À la période 3 : Ay, = 0,757 x 0,194 = 0,146 


Il s’agit d’une progression géométrique de premier terme U, = 0,256 et de raison 
g=0,757 < 1. 


La somme tend vers une limite finie et est égale à : U,/(-9)= 0,256/(1-0,757) 
= 1,053. 


Le prix augmentera de 1,053 unité à long terme. 


5) Il est normal que le R? soit plus élevé dans l’équation [E2] que dans l’équation [E3] 
car une variable explicative a été retirée du modèle ce qui entraine une diminution de la 
somme des carrées des résidus. 


6) À cause de la covariance existant entre les variable V1 et Xr. 


7) Un modèle du type y, = ay;_1 + €, dans lequel le coefficient a serait supérieur à 1 
conduirait à une solution explosive (croissance infinie) ce qui impossible. 


8) Tests de comparaison de coefficient 


HO : & pp = Gi mp2 
HI: @; yp1 À Qi mp2 
û — à — 0 0,757 — 0,695 ; 
t* — Gimri — dimri) = = 1,05 suit une Student à 


LES ES 0,025? + 0,053? 


n1 + n2 — 6 = 38 degrés de liberté, la covariance entre 4 mp1 © di mp SSt nulle car les 


deux régressions sont indépendantes (les deux échantillons sont différents), 
t* = 1,05 < 10,05 = 1,96 donc non rejet de HO. 
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Exercice n° 7 


Un modèle d’évaluation de la politique marketing 


Nous intéressons à mesurer l’impact de la publicité et des promotions sur les ventes 
d’un produit. Les impacts sont mesurés au moyen d’estimations en coupe instantanée 
menées sur des échantillons représentatifs de produit de grande consommation à forte 
pression marketing de deux secteurs : les produits cosmétiques et les détergents. 


Les chiffres entre parenthèses sous les coefficients de régression sont les écarts types 
des coefficients. 


Partie A 


Le premier modèle testé est le suivant : 


Vi = 49 + à Pui; + & Pris + &i [EI] 


V, = Vente en volume du produit i pour l’année t 
Pui;, = Dépenses publicitaires en euros pour le produit i pour l’année f 
Pri, = Dépenses promotionnelles en euros pour le produit À pour l’année t 


Les résultats obtenus pour une année (r = 1) pour le secteur des cosmétiques est le 
suivant : 


Vi = 812,86 + 29,94Pu; +21,31Pr;+e; i = 1,.…., 20 
(10,73) (8,23) 


R2 = 0,868 ; DW = 1,68 ; Somme des Carrés des Résidus = SCRÇ= 291 
1) Interpréter d’un point de vue statistique ce résultat d’estimation. 


2) Théoriquement si l’entreprise respecte une politique optimale d’allocation de son 
budget publi-promotionnel (marketing mix), les effets positifs d’un euro dépensé en 
publicité ou en promotion sont égaux (a, = a). Sachant que Cov(â;, à) = 6,75, effec- 
tuez le test permettant de savoir si cette politique optimale est vérifiée. 


3) Une interrogation concernant les études menées sur des échantillons d’entreprises 
réside en l’existence de comportements homogènes. 


Nous procédons donc à deux nouvelles estimations. 


Les résultats obtenus pour la même année (1 = 1) pour le secteur des détergents est 
le suivant : 


V; = 627,32 + 14,27Pu; + 17,87Pri+e; i = 1,…, 20 
(3,12) (5,57) 


R2 = 0,41 ; DW = 1,68 ; SCR,, = 249 


Les résultats obtenus pour la même année (f = 1) pour le secteur des détergents et 
des cosmétiques sont les suivants : 


V; = 785 + 16,56Pu; +18,91Pr;+e; i—1,.…, 40 
SCRy = 926 


Les modèles à décalages temporels e 203 


Tester l’homogénéité des comportements dans ces deux secteurs. Qu’en concluez- 
vous ? 


4) Dans le même esprit nous disposons pour le secteur des cosmétiques d’une estima- 
tion pour l’année suivante (1 = 2), nous allons donc chercher à tester la stabilité tempo- 
relle pour ce secteur. 


Sachant que l’estimation du modèle en { = 2 indique SCR, = 316 (i = 1, , 20) et 
qu’une estimation pour f = 1 et f = 2 indique SCR, = 1054, qu’en concluez-vous ? 


Partie B 


Un des problèmes de ce type de modélisation consiste en un biais dû à des variables 
omises, en particulier des variables caractéristiques du produit. 


1) Supposons que ces variables soient additives et peuvent être synthétisées globalement 
par une seule notée F;, cette variable est constante dans le temps car il s’agit d’une 
caractéristique permanente du produit. Cependant cette variable n’est pas mesurable. 


Le modèle s’écrit donc maintenant : 
Vi = do + ai Pui, + a Pris + Fi + ei [E2] 


Où t désigne l’année d’estimation et i le produit. 


Sachant que nous disposons des données pour 20 produits pour deux années consé- 
cutives, comment estimer les paramètres du modèle intégrant cet effet individuel sans 
qu’il apparaisse effectivement ? 


2) Si cet effet individuel n’est pas additif mais multiplicatif nous considérons alors qu’il 
peut être fonction du budget marketing M;, du produit i pour l’année f. On appelle 


V ; 
k: = D: le rapport moyen entre les ventes totales et le budget total marketing dans 
Lt 


l'échantillon pour tous les produits pour l’année f. 


Sous l’hypothèse que les effets individuels sont constants dans le temps on peut défi- 


; . V V Vic-1 
nir une variable | — | telle que | — = ———— —k,_; 
M M jen Mic-n 


Interpréter le sens de cette variable économique. En quoi son introduction dans 
l’équation [E1] permet-elle de mesurer les effets individuels ? 


3) On a obtenu pour les secteurs des cosmétiques et des détergents les résultats pour 
l’année t = 1. 


+ Cosmétique : 


V; = 582 +25,19Pu; +23,81Pr,; 097 ) te; i=1,..,20 
i@—D) 
(9,3) (5,7) (0,37) 
R? = 0,967 
+ Détergent : 
V; = 328 + 17,78Pu; + 18,74Pr,; | ) +e i=1,..,20. 
i(t—1) 
(5,7) (8,2) (0,21) 
R? = 0,967 


204 e ÉCONOMÉTRIE 


L'augmentation des coefficients de détermination R? pour chaque équation est-elle 
suffisante pour affirmer que la relation estimée est de meilleure qualité que l’équation 
[E1] ? Sinon comment jugez-vous de l’amélioration ou la détérioration des résultats. 


| ; V 
4) Les coefficients des variables (5) pour le modèle cosmétique et détergent 
i(t—1) 

sont-ils significativement différents ? 


Partie C 


Un des biais envisageables dans l’équation [E1] est que les ventes d’un produit 
soient fonction d’un événement imprévu. Dans cette situation, cela peut créer un biais 
sur les ventes du produit qui diffère de ce qu’elles seraient dans des conditions normales. 
Pour effectuer des prévisions correctes, on peut redresser ce biais en introduisant comme 
variable supplémentaire dans [E1] les ventes de la période précédente : 


Vi = ao + a Pui, + aPri; + a3Vi-1 + &i [E3] 
On a obtenu pour les secteurs des cosmétiques les résultats pour l’année f = 1. 


Vi = —1,52+2,52Pu;, +6,36Pr;;, +0,75V;;_1 +e; i = 1,..,20 [E4] 
(1,1) (1,7) (0,3) 


R? = 0,979 


1) Interpréter d’un point de vue statistique et économique ces résultats, est-il envisa- 
geable dans l’équation [E3] de tester une éventuelle autocorrélation des erreurs ? 


2) Pour ce modèle cosmétique nous avons effectué la régression suivante : 


e =2,1Pu; +0,18Pry +5,8+u; i = 1,.,20 
(0,2) (0,5) 


ei = Résidu de la régression [E4] 


Pourquoi procéder à cette régression ? Qu’en concluez-vous et que proposez-vous ? 


Solution 


A.1) Soit les tests suivants à mener. 
* Test de significativité globale de la régression : HO : a; = a = 0 
R?/k 0,868/2 
(— R?)/(n—k—1) - (1 — 0,868)/(20 —2 — 1) 
= 55,89 > É = 3,59, nous rejetons l’hypothèse HO, il existe au moins une variables 
Pu; ou/et Pr; d’explicative de V 


Soit le test de Fisher : F* = 


* Tester HO : a; = 0 contre l'hypothèse H1 : a; Z 0 
Le test d’hypothèses bilatéral consiste donc à comparer le ratio de Student empi- 


A 


à 

rique 1}, = es — 2,79 à la valeur du f de Student lue dans la table à 20 — 2 — 1 = 17 
Oû 

degrés de liberté et pour un seuil de probabilité égal à 5%, soit CAE = 2,11. Puisque 

15, = 2,79 > Fi = 2,11, nous refusons l’hypothèse HO, le coefficient a; est donc 


significativement différent de 0. 


Les modèles à décalages temporels e 205 


+ Soit à tester HO : a = 0 contre l'hypothèse H1 : a: #0 


& é : 
= zx =2,59 > Fi = 2,11 nous refusons l’hypothèse HO, le coefficient a2 est 
O 
donc significativement différent de 0. 


+ Le modèle étant spécifié en coupe instantanée et n’ayant aucune information sur 
un éventuel tri des données selon un critère, la statistique de Durbin et Watson n’est pas 


interprétable. 
A..2) Le test d’hypothèse est : HO : a; = & 
’ : :. Gr @) 0. : k à 
Sous l’hypothèse HO #* = ———— suit une loi de Student à17 degrés de 
Où -à2 


liberté. 


Il convient de calculer : 64,4, 
Var(ä1 — d)) = Var(à;) + Var(à) — 2 x Cov(ài,&) 


10,732 + 8,23? — 2 x 6,75 = 169,36 


_ 129,94 — 21,31] 
__ VT69,36 
HO, la politique optimale est donc respectée. 
A.3) Soit à tester (test de Chow) l’hypothèse HO : SCRr = SCRh + SCRc — HO : 
SCRr — (SCRD + SCRc) =0 

La statistique du Fisher empirique du test de Chow est donnée par : 
_ (SCRr — (SCRp + SCRc))/K + 1) 

(SCRD + SCRc)/(n —2(k+1)) 

(& + 1) et n — 2(k + 1) degrés de liberté. 


926 — (291 + 249))/3 
Soit, F* — c Car 8,10 > FŸ & 2,92. Nous refusons l’hypo- 
(291 + 249)/(34) | 


thèse HO, les comportements sont hétérogènes entre les deux secteurs. 


D'où : r* = 0,66 < ER = 2,11. Nous acceptons l’hypothèse 


* 


qui suit alors une loi de Fisher à 


A.4) Il s’agit toujours du test de Chow mais mené maintenant en données temporelles. 


1 054 — (291 + 316))/3 
Soit, F* = ( rene & 8,34 > po & 2,92. Nous rejetons l’hy- 
(291 + 316)/(34) | 
pothèse HO, les comportements sont différents, sur les deux années étudiées, pour le sec- 


teur des cosmétiques. 


B.1) Nous avons : 
Vi = Go + ax Puis + ax Pris + Fi + 8, 
Vis = Go + Ge Puis + Qui Pris + Fi + 8 
Puisque les effets sont constants nous avons : F5, = F;;-1 


Nous pouvons alors écrire : 


Vi Vis = (@or — Gor-1) + Ai Puis — ais Puis + a Pris — a3_1 Pris 
HEir — Eir-1 
L’estimation de ce modèle permet de lever le biais du aux caractéristiques de 
produit. 
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B.2) La variable (5) = Vian k;_1 = Vin Ven mesure les dévia- 
M }i6-n  Mie-n Min Mar 

tions individuelles du produit à par rapport au ratio des ventes totales sur les dépenses 

marketing totales pour tous les produits de l’année antérieure. Aïnsi cette variable capte 

ce qui est spécifique du produit par rapport au comportement moyen tendanciel. Si le 

coefficient de cette variable n’est pas significativement différent de 0, cela signifie que 

les produits ont tous le même comportement et donc qu’il n’existe pas d’effet individuel. 


B.3) Le coefficient de détermination est insuffisant pour évaluer la pertinence d’ajout 
d’une variable explicative supplémentaire car même une variable non significative 
contribue à augmenter la somme des carrées expliquées. En revanche il convient d’ef- 
fectuer un test de significativité par rapport à 0 sur la variable nouvellement introduite. 


0,97 
Soit pour le secteur cosmétique : f#, = sa = 2,62 et pour le secteur Détergent : 
. _ 10,49 ; 5 S 0,05 se 
ñ = —— = 2,33, les deux ratios sont supérieurs à f;; —2,11. L’ajout de la 
FF, 00 


variable (x contribue significativement à l’explication des ventes, il existe des 
i@—1) 


effets individuels par produit. De plus, les coefficients des variables Publicité et 

Promotion sont significativement différents de 0 et leurs valeurs se rapprochent, ce qui 

correspond mieux à l'intuition théorique. 

B.4) Le test d’hypothèse est : HO : af = a? 

_ IG@$ — à?) — 0 
Gas a 


n1 + n2 — 2(k + 1) = 32 degrés de liberté. 


Sous l’hypothèse HO, r* suit une loi de Student à 


Il convient de calculer : Gas à? 
Var(a£ — a?) = Var(à£) + Var(â?) — 2 x Cov(à£ à?) 
= 0,372 +0,21? —2 x 0 = 0,181 


Les régressions étant effectuées sur des échantillons indépendants la covariance est 
nulle. 


— 0,97 + 0,49 

D'où : 2 Pen LE 
0,181 

les deux coefficients ne sont pas significativement différents entre eux. 


= 1,13 < 44% & 1,96. Nous acceptons l'hypothèse HO, 


C.1) Les coefficients du modèle sont tous significativement différents de O0, les r de 
Student empiriques des trois coefficients sont supérieurs à EE = 2,11 nous refusons 
l'hypothèse HO de nullité des coefficients. Nous ne pouvons pas interpréter la statistique 
de Durbin et Watson car le modèle est estimé en coupe instantanée pour l’année f et nous 
ne savons pas si les données ont été préalablement triées. 


C.2) L’estimation de ce modèle permet de tester une éventuelle hétéroscédasticité des 
résidus (test de White), le coefficient de la variable Pu;, est significativement différent 
de 0, il existe donc une hétéroscédasticité liée à la variable Publicité. 


Il convient donc de corriger le modèle de l’hétéroscédasticité en procédant à une 


régression pondérée, dont le facteur de pondération est : 


Pui; 
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Exercice n° 8 


LT: fichier C7EX8 


Une comparaison des courbes de Phillips française et américaine! 


Soit les données annuelles françaises et américaines concernant les taux d'inflation 
et de chômage sur 34 ans. Le but de cet exercice est d’essayer de valider empiriquement 
les courbes de Phillips. Une démarche progressive est proposée. Dans un premier temps, 
vous devrez estimer la courbe qui relie le taux d’inflation au taux de chômage, puis celle 
qui relie l’inflation et le chômage retardée d’une période. Dans un deuxième temps, 
nous prendrons mieux en compte la dynamique qui relie l’inflation (niveau général des 
prix) à l'inflation salariale afin de valider empiriquement les mécanismes invoqués par 
Phillips. Enfin, dans un dernier temps, les anticipations d’inflation formées de manière 
adaptative seront prises en compte. Il est à noter que les séries peuvent suivre une dyna- 
mique dite « non-stationnaire », des procédures d’estimation abordées au chapitre 9 per- 
mettent alors d’en tenir compte. 


chofra = Chômage France 
chousa = Chômage États-Unis 
inffra = Taux d'inflation France 


infusa = Taux d'inflation États-Unis 
Première partie : Courbes inflation-chômage 


1) Visualiser successivement les deux courbes de chaque pays inflation-chômage dans 
le plan (chômage en abscisse et inflation en ordonnée). Constater la grande instabilité 
de celles-ci. 


2) Estimer économétriquement les deux équations inflation-chômage (respectivement 
France et États-Unis) qui relient le niveau d’inflation, variable expliquée (nommés res- 
pectivement inffra et infusa) à une constante et au niveau retardé du chômage, variable 
explicative (nommés respectivement chofra et chousa). 


Constater que cela ne modifie pas notablement les résultats de prendre comme variable 
explicative le taux de chômage contemporain et le taux de chômage retardé. Dorénavant, 
nous considèrerons le taux de chômage retardé. 


3) Examiner les résidus des deux équations (chômage retardé). Vous semblent-ils liés 
par une dynamique cyclique ? (présomption d’autocorrélation des résidus). Existe-t-il 
des résidus très éloignés des autres ? (présomption de valeurs aberrantes). 


4) Effectuer les tests de Durbin-Watson. Confirmer vos résultats en utilisant les tests 
d’autocorrélation des résidus de Breusch-Godfrey. 


1. Merci à Jean-François Jacques, professeur à l’Université de Paris-Est-Marne-la-Vallée, auteur 
de ce cas. 
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Deuxième partie : courbes de Phillips originelles (sans anticipation d’inflation) 
avec autocorrélation des résidus et choc négatif d’offre (année 11 et année 17) 


5) Construire une variable indicatrice appelée DUM qui vaut 0 à chaque date à l’excep- 
tion des périodes 11 et 17 pour lesquelles elle vaut 1. 


6) Soit les trois équations suivantes : 


* Équation de Phillips originelle qui relie le taux de croissance des salaires nominaux 
(w,) au taux de chômage (u,) : w, = À(ü — u;_1) avec ü = constante. 


* Équation qui relie inversement le taux de croissance de la production (f,) et celui du 


1 
chômage (pseudo-loi d’Okun) : ÿ, = ——ÿ, avec ü, = (u;-u;_1). 
a 


+ Équation de quasi-offre ou ce qui identique formellement équation de fixation des prix 
(P,) en taux de croissance en concurrence imparfaite : D, = € ÿ; + w.. 


Montrer qu’il est possible, à partir de ces équations, d’écrire une dynamique qui relie le 
taux d’inflation p, à une constante, au niveau du chômage ”, et au niveau du chômage 
retardé u,-_1. 


Estimer économétriquement cette équation. Est-ce que cela améliore les résultats de la 
première partie ? 


7) Estimer de nouveau le modèle de la question 6 en introduisant dans la liste des 
variables explicatives la variable DUM et en corrigeant de l’autocorrélation des résidus 
(cf. chapitre 5). 


Troisième partie : courbes de Phillips augmentées des anticipations d’inflation 


8) On cherche maintenant à estimer un modèle intégrant des anticipations d’inflation : 
Pi = do + ai Pr-1 + dus + d3ui-1 + Er 


Estimer cette relation inflation-chômage en ignorant l’autocorrélation des résidus mais 
en conservant la variable DUM. En faisant un test du h de Durbin (présence de la 
variable endogène retardée, cf. chapitre 7, I. B.) confirmer qu’il n’existe plus d’autocor- 
rélation des résidus. 


9) Réaliser sur ce nouveau modèle des tests de Chow à la période 21 pour la France et 
à la période 18 pour les Etats-Unis (date de début des politiques de désinflation). 
Attention : la variable DUM doit être retirée de la régression. 


10) Construire les séries pour la France et les États-Unis (phifra et phiusa) 
Phi = pr — à1pr-1 — àadum , les coefficients de régression proviennent du résultat de la 
question 8. Puis regarder l’allure de la courbe dans le plan chômage en abscisse et phi 
en ordonné. Que constatez-vous lorsque que l’on supprime les déplacements verticaux 
de long terme de la courbe de Phillips dus aux anticipations et aux chocs d’offre ? Une 
politique de désinflation est-elle plus coûteuse, en termes de chômage, en France ou aux 
États-Unis ? 


Solution 


1) À la lecture des représentations graphiques (graphique 7) de la relation inflation-chô- 
mage pour la France et pour les États-Unis, nous pouvons penser qu’il est très difficile 
de trouver une relation significative, pour les deux pays, entre le taux de chômage et le 
taux d'inflation à une date donnée car les deux courbes sont très instables. 
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Graphique 7 — Relation inflation-chômage pour la France et pour les États-Unis 


2) Estimations économétriques. 


Les résultats obtenus pour la France sont les suivants : 


Dependent Variable: INFFRA 
Included observations: 33 after adjusting endpoints 


Variable Coefficient Std. Error t-Statistic Prob. 

C 8.918367 1.304888 6.834582 0.0000 

CHOFRA(-1) —0.442073 0.173685 —2.545262 0.0161 
DW = 0,23 


On remarque que la probabilité critique de la variable chofra(—-1) est inférieure à 
5 %, donc le taux de chômage retardé est une variable significative et dont le coefficient 
est négatif, ce qui est conforme à l'intuition économique. 


Estimons maintenant la relation entre l’inflation et le taux de chômage contemporain. 


Dependent Variable: INFFRA 
Included observations: 34 


Variable Coefficient Std. Error t-Statistic Prob. 
C 8.273400 1.322230 6.257158 0.0000 
CHOFRA —0.345105 0.171588 —2.011250 0.0528 


Dans ce cas, nous remarquons que le taux de chômage contemporain n’est pas aussi 
significatif. En effet, la probabilité critique est légèrement supérieure à 5 % mais reste 
quand même acceptable. 


Pour les États-Unis : 


Dependent Variable: INFUSA 
Included observations: 33 after adjusting endpoints 


Variable Coefficient Std. Error t-Statistic Prob. 

C 5.718162 2.147358 2.662883 0.0122 

CHOUSA(-1) —0.093347 0.343655 —0.271629 0.783877 
DW = 0,42 
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Dependent Variable: INFUSA 
Included observations: 34 


Variable Coefficient Std. Error t-Statistic Prob. 
C 2.329524 2.082007 1.118884 0.2715 
CHOUSA 0.449518 0.335099 1.341446 0.1892 


On remarque que ni le taux de chômage retardé, ni le taux de chômage contempo- 
rain ne sont significatifs car leurs probabilités critiques sont supérieures à 5 %. 


Nous pouvons donc conclure que le fait de prendre le chômage retardé ou le chô- 
mage contemporain ne change pas significativement les résultats. Nous prendrons donc 
dans la suite le chômage retardé afin de rester homogène par rapport à la France. 


3) La représentation graphique (graphique 8) des résidus de la relation inflation-chôma- 
ge retardé pour la France et pour les États-Unis laisse supposer une présence d’autocor- 
rélation positive des résidus car il semblerait que les résidus soient liés par une dyna- 
mique cyclique. En ce qui concerne les points aberrants, il apparaît des résidus éloignés 
pour les périodes 10 et 18 pour la France alors que pour les États-Unis, les résidus sont 
élevés pour les périodes 10 et 17. 


& à & D © ND 8 © © 
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Graphique 8 - Représentation des résidus pour la France et pour les États-Unis 


4) Tests d’autocorrélation des erreurs. 


Pour la France, il est possible d’appliquer le test de Durbin et Watson à la relation entre 
l'inflation et le taux de chômage retardé car le nombre d’observations est supérieur à 15, 
la variable à expliquer ne figure pas parmi les variables explicatives et le modèle est spé- 
cifié en séries temporelles. La statistique de Durbin et Watson est égale à 0,23. Dans la 
table de Durbin et Watson, pour 33 observations et une variable explicative, on trouve 
que d, = 1,38 et d, = 1,51. La statistique de Durbin et Watson dans ce cas est inférieure 
à d,, on peut donc conclure à une autocorrélation positive des erreurs. 


Il est également possible de faire le test de Breusch-Godfrey. 


Breusch-Godfrey : Serial Correlation LM Test: 
F-statistic 73.24807 Probability 0.000000 


On rejette l’hypothèse d’absence d’autocorrélation car la probabilité critique du 
Fisher est très inférieure à 5 %. 
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Pour les États-Unis, la statistique de Durbin et Watson est égale à 0,42. Or d,etd, 
ont les mêmes valeurs que pour la France, donc on peut conclure à une autocorrélation 
des erreurs. 


Breusch-Godfrey : Serial Correlation LM Test: 
F-statistic 48.13823 Probability 0.000000 


On rejette l’hypothèse d’absence d’autocorrélation car la probabilité critique du 
Fisher est inférieure à 5 %. On peut donc conclure à une autocorrélation positive des 
erreurs. 


5) Construire une variable appelé DUM qui vaut O0 à chaque date à l’exception des 
périodes 11 et 17 pour lesquelles elle vaut 1. 


6) Estimation de la courbe de Philips sans autocorrélation des résidus. 


Soit le système suivant : 


d, = À(G —u;_1) (D) 
ÿ — al, (2) 
Bi = cÿ, + à (3) 


En remplaçant dans l’expression (3) ÿ, et w, par les relations (2) et (3), on trouve que : 
Bi = c(—a là) +AG —u; 1) 


BP LL a lc(u, Uj_1) + AG —u;_;) car à, = (u-u;_1) 


D'où p, = -a cu;(x + lchu;_1 + Àù 
Nous pouvons alors estimer cette équation. 


Pour la France : 


Dependent Variable: INFFRA 
Included observations: 33 after adjusting endpoints 


Variable Coefficient Std. Error t-Statistic Prob. 

C 8.195813 1.341090 6.111305 0.0000 
CHOFRA 1.978700 1.187570 1.666176 0.1061 
CHOFRA(-1) —2.412074 1.194353 —2.019565 0.0524 
Durbin-Watson stat 0.436616 


On remarque que les deux variables ne sont pas significatives car leurs probabilités 
critiques sont supérieures à 5 %. 


Pour les États-Unis : 


Dependent Variable: INFUSA 
Included observations: 33 after adjusting endpoints 


Variable Coefficient Std. Error t-Statistic Prob. 
C 4.123759 2.073971 1.988340 0.0560 
CHOUSA 1.363228 0.533217 2.556610 0.0159 
CHOUSA(-1) —1.192817 0.533991 —2.233777 0.0331 
Durbin-Watson stat 0.683192 
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En ce qui concerne les États-Unis, ce modèle est plus adapté que les deux précédents 
car les deux variables (chômage et chômage retardé) sont significatives. 


7) Estimation d’un nouveau le modèle en introduisant la variable DUM et en prenant en 
compte l’autocorrélation des résidus. 
Pour la France : 


Dependent Variable: INFFRA 
Included observations: 32 after adjusting endpoints 


Variable Coefficient Std. Error t-Statistic Prob. 
C 15.14060 6.269402 2.414999 0.0228 
CHOFRA —0.254229 0.522127 —0.486910 0.6303 
CHOFRA(-1) —0.788179 0.495101 —1.591958 0.1230 
DUM 2.674737 0.797477 3.354000 0.0024 
AR(1) 0.866577 0.081842 10.58842 0.0000 
Durbin-Watson stat 1.791241 


On constate dans ce modèle que les chômages retardés et contemporains ne sont pas 
significatifs. 


Pour les États-Unis : 


Dependent Variable: INFUSA 
Included observations: 32 after adjusting endpoints 


Variable Coefficient Std. Error t-Statistic Prob. 
C 12.66870 3.475067 3.645597 0.0011 
CHOUSA 0.221311 0.292094 —0.757670 0.4552 
CHOUSA(-1) —0.963667 0.296656 —3.248427 0.0031 
DUM 2.293875 0.767918 2.987137 0.0059 
AR(1) 0.895121 0.086378 10.36288 0.0000 
Durbin-Watson stat 1.552390 


On remarque que dans ce cas, le chômage contemporain n’est plus significatif, alors 
que le chômage contemporain l’était dans le modèle précédent, non corrigé des auto- 
corrélations des résidus et des points aberrants. 

8) On cherche maintenant à estimer le modèle suivant : 

Dr = Go + di Dr + dou + asus + 8. 


Il s’agit d’un modèle autorégressif d’ordre 1. 
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Pour la France : 


Dependent Variable: INFFRA 
Included observations: 33 after adjusting endpoints 


Variable Coefficient Std. Error t-Statistic Prob. 
C 1.663308 0.625929 2.657345 0.0129 
INFFRA(-1) 0.831080 0.063433 13.10170 0.0000 
CHOFRA —0.360813 0.439505 —0.820953 0.4186 
CHOFRA(-1) 0.225252 0.448785 0.501916 0.6197 
DUM 4.995335 0.898138 5.561881 0.0000 
Durbin-Watson stat 2.195938 


Nous remarquons que les variables choffra et choffra(—-1) ne sont pas significatives ; en 
revanche, le terme autorégressif est bien significativement différent de O. 


Nous effectuons le test À de Durbin car nous avons un modèle autorégressif (présence 
de la variable à expliquer comme variable explicative retardée). 


Soit le test d’hypothèses HO : À = 0 contre H1 : h 40. 


ñ DW 
h=|p| [—— avec p = 1——— donc p — -0,098 
1 — n0;, 2, 


33 
1 — 33 x 0,06342 
corrélation des erreurs. 


h = |0,98] = 0,60 < 1%% — 1,96. Il n’existe donc plus d’auto- 


Pour les États-Unis : 


Dependent Variable: INFUSA 
Included observations: 33 after adjusting endpoints 


Variable Coefficient Std. Error t-Statistic Prob. 

C 3.704137 0.966380 3.833004 0.0007 
INFUSA(-1) 0.916993 0.115893 7.912443 0.0000 
CHOUSA —1.025115 0.356171 —2.878159 0.0076 
CHOUSA(-1) 0.442910 0.295441 1.499151 0.1450 
DUM 4.630472 1.005135 4.606815 0.0001 
Durbin-Watson stat 2.047469 


Dans ce modèle, seul le taux de chômage décalé n’est pas significatif. On peut éga- 
lement effectuer le test du h de Durbin, h = 0,182 qui est très inférieur à 1,96. Il n’exis- 
te donc plus d’autocorrélation des erreurs. 
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9) Tests de Chow!. 
Pour la France : 


Le test de Chow est effectué à la période 20 comme période charnière. Comme pour la 
deuxième période, la variable DUM est égale à 0 (colinéarité avec le terme constant), 
nous la retirons pour les deux périodes. 


Nous obtenons : SCR = 83,25 ; SCRI = 70,03 ; SCR2 = 5,056. 


Chow Breakpoint Test: 21 
F-statistic 0.678912 Probability 0.613020 


Pour les États-Unis : 


Nous obtenons : SCR = 80,59 ; SCRI = 52,04 ; SCR2 = 7,93. 


Chow Breakpoint Test: 18 
F-statistic 2.148648 Probability 0.104452 


Nous acceptons l’hypothèse que le fait de scinder en deux sous périodes n’amélio- 
re pas le modèle pour la France et les Etats-Unis. 


10) Nous construisons les deux séries phi = p; — di p;_1 — âadum pour la France et les 
États-Unis : 


phifra, =inffra; —0,83inffra;_1 — 4,99dum, 
phiusa, = infusa,; — 0,91infusa,;_1 — 4,63dum, 


À la lecture de la représentation graphique (graphique 9) pour les États-Unis et la France 
de la relation entre le chômage et phi, nous remarquons que la tendance de la courbe de 
la France a une pente moins importante que celle des États-Unis, ce qui nous permet 
d’émettre l’hypothèse qu’une politique de désinflation a moins d’effets négatifs aux 
États-Unis qu’en France. Nous pouvons donc en conclure qu’une politique de désinfla- 
tion est plus coûteuse en termes de chômage en France qu’aux États-Unis. 


PHIFRA 
PHIUSA 


Bb & À 4 © = ND © p 


CHOFRA CHOUSA 


Graphique 9 - Relation entre le chômage et phi pour la France et pour les États-Unis 


1. À titre d'exercice, le lecteur vérifiera les résultats proposés par le logiciel, cf. chapitre 3, IV. B. 


Les modèles à décalages temporels e 215 


ntroduction 
aux modèles 
à équations simultanées 


e chapitre est une introduction! aux modèles dont la spécification 
nécessite l'écriture d'équations multiples réliées entre elles au tra- 
vers de variables figurant dans plusieurs équations. 
Nous ne pouvons pas, sauf cas particulier, utiliser la méthode des MCO 
équation par équation comme si chacune de ces équations était indé- 
pendante les unes des autres. 
En |., nous envisageons la présentation matricielle d'un modèle à équa- 
tions simultanées et à son écriture sous forme réduite (les variables 
endogènes sont exprimées en fonction des seules variables exogènes). 
Le problème de l'identification, c'est-à-dire la possibilité d'estimation du 
modèle sous forme réduite, est étudié en Il. Enfin, enIll., nous présentons 
les méthodes d'estimation spécifiques des modèles à équations simulta- 
nées. 
Les exercices d'application se trouvent exceptionnellement tous en fin de 
chapitre, la partie théorique étant relativement réduite. 


1. Dans le cadre de ce manuel, nous limitons volontairement les développements théoriques qui 
peuvent se révéler complexes dans le domaine de l’économétrie en général, et des équations 
simultanées en particulier. Le lecteur désirant approfondir ce chapitre peut se référer à Greene 
W.H. chapitre 16, 2000. 
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quations structurelles 
et équations réduites 


Lorsque nous sommes en présence d’un modèle linéaire à équations multiples, 
il arrive fréquemment qu’une variable endogène d’une équation apparaisse en 
tant que variable explicative d’une autre équation. Ce double statut de certaines 
variables entraîne un biais dans les estimations des coefficients lorsque nous 
employons les MCO, équation par équation. 


Nous allons donc chercher à transformer le modèle initial en un modèle où 
les variables endogènes ne sont exprimées qu’en fonction des variables exo- 
gènes. 


xemple introductif 


Considérons le modèle macro-économique à trois équations : 


C = do + a, + Er [E1] 
I, = bo E biY; + Ex [E2] 
y, = C; = I, [E3] 


avec : 


C, = consommation totale pour l’année f ; 
I, = investissement total pour l’année r ; 
Y, = revenu total pour l’année r. 


Ce système d’équations multiples, spécifié par l’économiste, qui traduit 
directement les relations entre les variables, s’appelle : le système d'équations 
structurelles. 


Ce modèle comporte trois équations dont une identité [E3]. En effet, dans la 
relation [E3], il n’y a aucun coefficient à estimer et par conséquent pas de terme 
aléatoire. L’équation [E1] est une fonction de consommation et l’équation [E2] 
est relative à l’investissement. 


Ce système contient trois variables endogènes : C;, 1,, Y, et une variable exo- 
gène Y,,. Nous remarquons, par exemple, que la variable Y, apparaît comme 
variable explicative en [EI], ce qui est contraire à son statut de variable endo- 
gène. 
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Pour lever ce problème, nous allons exprimer les trois variables endogènes 
(C;,L,,Y,) en fonction de la seule variable exogène (Y,_;). 


En substituant [E3] dans [E1], nous obtenons : 
C, = do + a(C, + I) + Er = +ac, + al, + Êts 


En remplaçant , par son expression [E2] et en faisant passer a,C, à gauche de 
l'équation, nous pouvons écrire : 


(A —a)C; = 49 + &ibo + &biŸ,_; + aies + er 


OU EnCOTE : 


Gi MP ee à ab: 7. + M62 À Eu 


1—a; 1 — a; 


1—a; 


Il en résulte que : 


do + ab ab diE£x + Er 
V=C+I = "© +b+ Le + bi Vi + ET 2 
1—-a; 1 — a; 1—-a 
b b 1 : 
= &o + Do n 1 r — Ex + Ei 
1—-a 1— a; 1—-a; 


Les équations structurelles sont alors équivalentes aux équations réduites 
(les variables endogènes sont exprimées en fonction des seules variables exo- 
gènes) : 


b b t t 
Ê= do + dibo CA + diE£x + Ei [FA] 
1—-a; 1—a; 1—-a, 
b b t t 
ÿ, = do + Do : 1 + Ex + Ei [ES] 
1—a; 1—-a, 1—a 
L, = bo + biY,_: + € [E6] 


L’équation [ES] indique que la variable Y, est fonction de #,, et par consé- 
quent E(Y, &,;) £ 0. Il en résulte que, dans l’équation [E1], l'hypothèse d’indé- 
pendance entre la « variable explicative » Y, et l’erreur &,, n’est pas respectée et 
l'application des MCO sur le modèle [E1] conduit à des estimateurs biaisés et 
non convergents. 


En revanche, l’utilisation des MCO sur les équations réduites est licite 
puisque la variable Y,_; est indépendante de &,, et &. 


Il est noter que la forme réduite permet de mesurer l’effet total, direct et indi- 
rect, d’une modification de la variable exogène Y,_, sur les variables endogènes. 
Par exemple, le schéma suivant illustre la cascade des causalités : 


[E2] [E3] [EI] 
Y, — 1, — Y, = C, ce qui est résumé dans [E4]. 
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e modèle général 


Soit le système général de g équations structurelles liant g variables endogènes 
à k variables prédéterminées : 


buy + Doÿn + 2 + bisVe + CuXn + CoXa +. + CiXx = En 
Da Yu + bnYn + 2. + bi Ve + CuXi + CoXa +... + Cikx = Ex 


DaYu + DoYn Su Des Ver + Cdi À Clan + ee. + Cox = Eer 
Soit, sous forme matricielle : 


B Y “+: C X = & 
(gg) (g,1) (g,k)  (K,1) (g,1) 


Bien entendu, dans chaque équation, quelques coefficients sont nuls et la 
variable dont le coefficient est égal à 1 est la variable dépendante. Si une équa- 
tion a tous ses coefficients, non nuls, égaux à 1 et ne comporte pas de terme aléa- 
toire, cela signifie qu’il s’agit d’une identité (aucun coefficient n’est à estimer). 


[1] 


S1 la matrice B est régulière, nous passons de la forme structurelle à la forme 
réduite en exprimant Y en fonction de X, soit : 


Y=-B'CX+8B 'e [2] 


et nous pouvons appliquer les MCO. En effet, les erreurs B-'e sont indépen- 
dantes de X. 


Si, sur le plan de la présentation, la formalisation est simple, sa mise en 
œuvre pratique est plus complexe. En effet, la connaissance des g x k éléments 
de la matrice (—-B7'C) ne permet pas de déterminer — d’identifier — la matrice 
B (composée de g x g éléments) ainsi que la matrice C (composée de g xk 
éléments). Nous sommes alors en présence de gxk équations à 
(g x g)+(g x k) inconnues qui, sans restrictions supplémentaires, s’avèrent 
impossibles à résoudre, il s’agit du problème de l’identification. 


Nous allons donc présenter en IL. des règles simples permettant, à partir de 
restrictions sur les paramètres, de déterminer des conditions d’identification. 


À titre d'illustration le modèle introductif peut s’écrire sous forme matri- 
cielle : 


GC 1 O0 —a U —do 0 
r-|1 | o-| 0 1 à | Fe Ê c-| | 
Y, Shù El. À Fe 0 O0 


220 e ÉCONOMÉTRIE 


as particulier : les modèles récursifs 


Un système d’équations est appelé « récursif » si chaque variable endogène peut 
être déterminée de manière séquentielle : 


Vi = ir Xurs Eir) 
Va = FOX Xus Vus Eu) 
Va = rx Xe Visas Eu) 
(Les variables aléatoires (£;,) sont, par hypothèse, indépendantes.) 


Nous observons que la première équation ne contient aucune variable endo- 
gène. La deuxième équation a pour variable «explicative » endogène, la 
variable de la première équation, et ainsi de suite. 


Lorsqu'un modèle à équations simultanées répond au critère de récursivité, 
il est licite d’appliquer la méthode des MCO équation par équation. En effet, 
dans ce cas particulier, il y a indépendance entre les variables endogènes et les 
erreurs. Par exemple, dans la deuxième équation, y,, dépend de &,, mais pas de 
Er. 

Les modèles récursifs sont aussi appelés « système triangulaire » car les 
coefficients des variables endogènes forment un triangle au sein de la matrice B. 


e problème de l'identification 


estrictions sur les coefficients 


Il y a une restriction sur un coefficient de la forme structurelle, chaque fois 
qu’un paramètre est contraint — par l’écriture du modèle — à être égal à une 
valeur déterminée. Nous distinguons deux types de restrictions. 


1) Restrictions d'exclusion 


Nous pouvons considérer que chaque fois qu’une variable endogène ou exogè- 
ne n’apparaît pas dans une équation structurelle, cela revient à l’affecter d’un 
coefficient nul. Par exemple, dans notre modèle introductif, la variable Z, ne 
figure pas dans l’équation [E1], son coefficient est donc nul : dans la matrice B, 
l’élément de la première ligne et de la deuxième colonne est égal à O. 


2) Restrictions linéaires 


Certaines spécifications de modèle imposent que des variables soient affectées 
d’un coefficient identique, il s’agit là encore de restrictions a priori sur les para- 
mètres du modèle. 
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onditions d'identification 


Les conditions d’identification se déterminent équation par équation. Nous pou- 
vons distinguer trois cas d’identifications : 


— le modèle est sous-identifié si une équation du modèle est sous-identifiable 


(il y a moins d’équations que de paramètres à identifier dans la forme 
structurelle, le système est donc impossible à résoudre) ; 
— le modèle est juste identifié si toutes les équations sont justes identifiables ; 


— le modèle est sur-identifié si les équations du modèle sont soit justes iden- 
tifiables, soit sur-identifiables. 


Si le modèle est sous-identifié, il n'existe aucune possibilité d'estimation des 
paramètres du modèle, celui-ci doit être respécifié. 


Les conditions d’identification peuvent faire l’objet d’un développement 
complexe, nous nous bornons ici à édicter des règles simples qui sont, dans la 
pratique, appliquées en premier lieu. 


Soit : 


g = nombre de variables endogènes du modèle (ou encore nombre d’équations 
du modèle) ; 


k = nombre de variables exogènes du modèle ; 
g' = nombre de variables endogènes figurant dans une équation ; 
k' = nombre de variables exogènes figurant dans une équation. 


Lorsque les restrictions ne sont que des restrictions d’exclusion, les condi- 
tions — nécessaires — d’identifiabilité s’énoncent ainsi : 


g—1>g-g'+k-—k — l'équation est sous-identifiée ; 
g—1=g-g+k-k — l'équation est juste identifiée ; 
g—1<g-g'+k—k — l'équation est sur-identifiée. 


Ce qui peut se résumer ainsi : pour qu’une équation ne soit pas sous-identi- 
Jiée, le nombre de variables exclues de l’équation doit être au moins égal au 
nombre d'équations du modèle moins 1. 


Lorsque nous avons r restrictions, autres que celles d’exclusion, concernant 
les paramètres d’une équation (égalité de deux coefficients, par exemple), les 
conditions précédentes deviennent : 


g—1>g-g+k-k +r — l'équation est sous-identifiée ; 
g—1=g-g+k—-k +r — l’équation est juste identifiée ; 
g—1<g-g'+k—k +r — l'équation est sur-identifiée. 


Ces conditions — nécessaires — sont appelées conditions d’ordre d’identifiabilité. 
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Il convient de vérifier des conditions suffisantes, qualifiées de conditions de 
rang qui, dans la pratique, se révèlent difficiles, voire parfois impossibles à 
mettre en œuvre. En annexe, ces conditions sont exposées. 


es méthodes d'estimation 


Les méthodes d’estimation que nous pouvons utiliser dans le cadre des équa- 
tions simultanées sont fonction du critère d’identifiabilité du modèle. 


+ Si le modèle est sous-identifiable ; pas d’estimation possible. 


Dans le cas d’un modèle juste ou sur-identifiable, nous pouvons distinguer la 
méthode à employer équation par équation, selon le critère d’identifiabilité : 


+ Si l'équation est juste identifiée : les moindres carrés indirects ou les doubles 
moindres carrés. 


* Si l'équation est sur-identifiée : les doubles moindres carrés. 


es moindres carrés indirects 


La méthode des Moindres Carrés Indirects (MCD consiste à appliquer la métho- 
de des MCO aux équations justes identifiées du modèle sous formes réduite ; 
elle se compose de trois étapes : 


— mise sous forme réduite du modèle structurel ; 
— estimation par les MCO des paramètres de chacune des équations ; 


— détermination des coefficients des équations structurelles à partir des rela- 
tions algébriques entre coefficients réduits et structurels (puisque le modè- 
le est juste identifiable, la solution est unique). 


L’estimateur des MCI de la forme réduite est BLUE. Cependant, l’estimateur 
des coefficients de la forme structurelle, obtenu à partir de l’estimateur optimal 
des MCL est biaisé pour les petits échantillons. Les propriétés asymptotiques 
font tendre ce biais vers 0, lorsque la taille de l’échantillon augmente. 


Cet estimateur des MCI est rarement utilisé du fait de la difficulté, pour les 
modèles importants, de déterminer la forme réduite du modèle. Nous lui préfé- 
rons l’estimateur des doubles moindres carrés, plus simple à mettre en œuvre et 
qui fournit les mêmes résultats que les MCI pour les équations justes identifiées. 


es doubles moindres carrés 


La procédure d’estimation des Doubles Moindres Carrés (DMC) est la plus utili- 
sée en pratique. Elle s’applique pour tous les modèles justes ou sur-identifiables. 
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Cette méthode des DMC est fondée, comme son nom l’indique, sur l’applica- 
tion en deux étapes des MCO. 


Soit le modèle à équations simultanées à g variables endogènes et k 
variables exogènes : 


buiYu + Doÿa + 2 + bisVe + CuXu + CoXu +. + CiXx = En 
ba Yu + bnÿn + 2. + biVe + CuXi + CoXu +... + Cxkx = Eu 


ba Yu + DoYn +. + bee Ver + Cat + CoXn + 22 + Cox = Eu 


La première étape consiste à effectuer une régression de chacune des 
variables endogènes sur toutes les variables exogènes : 


Vu = AiXi + LnoXx +... + diuXx + Ur 


Var = Xi + AnXx +... + ŒuXx + Us 


Ver = LeiXi + eXa + + oXke + gi 


Puis, dans une deuxième étape, il convient de remplacer les variables endo- 
gènes figurant à droite des équations structurelles par leurs valeurs ajustées à 
l’aide des modèles estimés : 


Yu = Bi2Ÿx LR LE BV + CuiXi + CoXax +... + CiXu + Er 
Va = Bu +... + Bag Ver + CXir + CoXn +... + CuXx + En 


Ver = Ba Vu + Bear + +2. + CeiXir + Cox + 2 + CorXer + Eer 


Les propriétés de l’estimateur des DMC sont identiques, de manière asymp- 


totique, à celles d’un estimateur classique ; c’est-à-dire que pour les petits 
échantillons les estimations des paramètres peuvent être biaisées. 


Il est à noter que l’estimateur des DMC peut s’interpréter comme étant un 
estimateur de la méthode des Variables Instrumentales!, les variables exogènes 
des autres équations étant les instruments. 


utres méthodes d'estimation 


Nous pouvons citer trois méthodes : 


— La méthode des triples moindres carrés est adaptée lorsque les erreurs sont 
autocorrélées et/ou hétéroscédastiques, elle consiste à déterminer l’estima- 
teur des doubles moindres carrés puis à calculer l’estimateur des MCG. 


N 


— La méthode du maximum de vraisemblance à information complète 
(MVIC) consiste à maximiser la fonction Log-vraisemblance associée au 
modèle. 


1. Greene WH,., pages 681-684, 2000. 
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— La méthode des moments généralisée est utilisée en cas de présence d’hé- 
téroscédasticité. 


Exercice n° 1 


LL, fichier C8EX1 


Comparaison des résultats par moindres carrés ordinaires, 
moindres carrés indirects et doubles moindres carrés 


Soit le modèle suivant sous forme structurelle : 


Yu = ax + Xi) + eu [E1] 
Ya = bYu + CYi1 + 8x [E2] 
avec : 
Yi = Produit National Brut pour l’année f ; 


Y = consommation des ménages pour l’année f ; 
X1, = demande finale autre que consommation des ménages pour l’année f. 


Nous disposons des données du tableau 1 dans lequel les variables ont été préalable- 
ment centrées. 


Tableau 1 — Variables macro-économiques centrées 


t Yi Ya Xi Yi 

1 — 30,0 — 14,0 — 26,0 20,0 
2 — 4,0 10,0 5,0 — 30,0 
3 — 19,0 — 19,0 — 36,0 — 4,0 
4 — 6,0 — 11,0 — 6,0 — 19,0 
> — 9,0 6,0 — 13,0 — 6,0 
6 11,0 — 12,0 25,0 — 9,0 
7 9,0 10,0 5,0 11,0 
8 19,0 11,0 32,0 9,0 
9 29,0 19,0 14,0 19,0 


1) Préciser les conditions d’identifiabilité du modèle. 


2) Estimer les équations de la forme structurelle par les MCO et démontrer que les esti- 
mateurs ne sont pas BLUE. 


3) Estimer les coefficients par les MCI et les DMC. 
4) Comparer les résultats obtenus. 


Solution 


1) Nous nous référons aux conditions d’identification développées en IL. 


Le modèle comporte deux variables endogènes, Yi, et Y, soit g — 2, et deux 
variables exogènes, X1, et Y1,_, soit k = 2. 
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La première équation [E1] comporte une restriction d’exclusion et une restriction de 
contrainte (les coefficients de Y2 et X, sont égaux). Soit, en appliquant les conditions 
d’identifiabilité, les variables figurant dans l’équation donnent : g’ =2, k’ —1 et la 
contrainte d’égalité des coefficients : r = 1. 


Soit: g—g'+k-k'+r=2-2+2-1+1—-2>g—-1—-1, l'équation [El] 
est sur-identifiée. 


Pour l’équation [E2], nous avons g’ = 2, k' = 1 et r — 0, soit 
g—g'+k-k'+r=2-24+2-1+0=1—=8g-1, 
l’équation [E2] est juste identifiée. 
Nous pouvons donc estimer les coefficients du modèle. 


2) Les résultats de l’estimation par les MCO sont les suivants après avoir créé la nouvel- 
le variable explicative : somme de Y, et X.. Il est à noter que le modèle ne comporte 
pas de terme constant puisque les données sont centrées. 


[E3] 
Yi = 0,516(V2 + X 15) + en 
(5,89) 
R? = 0,81 
n =9 


() = 1 de Student 


[E4] 
Y> = 0,518 Y + 0,040 Yi + € 
(2,58) (0,18) 


R° = 0,50 
n =9 
Ces estimateurs ne sont pas BLUE. En effet, si on explicite Y1, en fonction de X,, et 
de Yi;_1, on obtient : 
y. = a SE ac y . £a 
HT Leu NT Tea Ted 


Or, dans l’équation [E2], on régresse Y,, sur Ÿ1, qui dépend aléatoirement de &:,, ce 
qui est en contradiction avec l’hypothèse d’indépendance entre la variable explicative et 
l’erreur. Les estimateurs ne sont donc pas BLUE. 


3) Pour appliquer la méthode des MCL, il convient d’abord de mettre le modèle sous 
forme réduite, soit : 


a ac € Et 


er nl re du [ES] 
ou encore : 
Vie = GX 1 + 2 Yir-1 + Vi 
Pau = d3X 1 + Yi + Var 
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Les résultats d’estimation par les MCO sont les suivants : 
[E7] 
Yi = 0,717 X\1 + 0,190 Yi + €ïr 
(4,93) (1,0) 
R° = 0,78 
n =)9 
() = t de Student 
[E8] 


Ya = 0,355 X,, +0,139Y;,_; +es 
(1,92) (1,0) 
R? = 0,36 
n =9 


Or le modèle sous forme matricielle s’écrit : 


1 —a Yu F —a 0 X1 _ | &r 
—b 1 Y> O0 —c Yii E € 
B X Y + C x _X = 1 E 
ou encore Ÿ = —B-ICX + B-le — AX + v qui est le modèle sous forme réduite avec 


A = —B7'C (A est la matrice des coefficients estimés de la forme réduite). 


Nous avons donc BA = —C, soit : 
1 —a][0,717 0,190 | a O0 
—b 1 0,355 0,139| [0 < 
0,717 — a x 0,355 = a 
0,190 — a x 0,139 = 0 


—b x 0,717 + 0,355 = 0 
—b x 0,190+0,139=c 


ce qui donne : 


Nous pouvons, à partir des deux dernières relations, estimer b — 0,495 et 
© = 0,045 (puisque l’équation [E2] est juste identifiée), mais, en revanche, le coefficient 
a est indéterminé (l’équation [E1] est sur-identifiée). 


Nous appliquons maintenant la méthode des DMC afin d’estimer tous les coefficients 
de ce modèle. 


Nous allons développer le calcul pour la première équation. 


Étape 1 : régresser la variable endogène Y:, sur toutes les variables exogènes (X1, et 
Y 1). 


Le résultat est déjà connu, puisqu'il s’agit de l’équation [E8]. 
Étape 2 : calculer la série ajustée : 2 
soit : Ya = 0,355 Xi + 0,139 Yi 


Étape 3 : la variable endogène Y,, est remplacée par sa valeur ajustée Fr dans l’équa- 
tion [EI] : Yi = a(Ya + Xi) + eu. 
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Le résultat d’estimation par les MCO est le suivant : 


Yi = 0,535 D, + X11) + er 


(5,22) 
R? = 0,77 
n =9 


() = 1 de Student 
Cette procédure des DMC est donc un peu lourde à mettre en œuvre, c’est pourquoi les 
logiciels permettent en une seule instruction d’utiliser cette méthode. Par exemple, pour 
estimer la deuxième équation de notre modèle, l’instruction de Eviews est la suivante : 


TSLS Y2 Y1(-1) Y1 @ XI YI(- 1) 


où TSLS est l’abréviation de Two-Stage Leasts Squares. La variable à expliquer (Y2) 
figure suivie des variables exogènes — Y1(- 1), la seule dans cette équation — et, enfin, on 
cite, la variable endogène que l’on désire remplacer par sa valeur ajustée à l’aide des 
séries exogènes (elles sont séparées de la variable endogène par le signe @). 


Le résultat, fourni par Eviews, est le suivant : 
Dependent Variable : Y2 
Method: Two-Stage Least Squares 


Included observations: 9 
Instrument list: X1 Y1D 


Variable Coefficient Std. Error  1-Statistic Prob. 
Y1D 0.045084 0.220336 0.204614 0.8437 
Y1 0.495344 0.228271 2.169985 0.0666 
R-squared 0.503610 Mean dependent var 0.000000 
Adjusted R-squared 0.432697 S.D. dependent var 13.87444 
S.E. of regression 10.45016 Sum squared resid 764.4403 
F-statistic 5.176628 Durban-Watson stat 3.011822 
Prob(F-statistic) 0.057037 


Nous remarquons que l’estimation des coefficients est exactement la même que par 
la méthode des MCI. En effet, nous rappelons que la méthode des MCI fournit des résul- 
tats strictement identiques à la méthode des DMC. C’est pourquoi, dans la pratique, seule 
cette dernière est utilisée car elle se révèle d’un maniement bien plus aisé. 


4) Nous pouvons au sein du tableau 2 comparer l’ensemble des résultats obtenus. 


Tableau 2 — Résultats d'estimation par les MCO et DMC 


MCO DMC 


a 0,516 0,535 
(5,89) (5,29) 
b 0,518 0,495 
(2,58) (2,17) 
c 0,040 0,045 


(0,18) (0,20) 
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À la lecture de ces résultats, nous constatons des différences assez faibles entre les 
estimations des MCO et celles des DMC. En effet, les propriétés des estimateurs des 
DMC ne sont qu’asymptotiques, or le nombre d’observations dans cet exemple est limi- 
té à 9. 


Exercice n° 2 


Le problème de l’identification lorsque la structure 
d’un modèle change 


On considère le système d’équations : 


Yu + aYx +b=er; [EI] 
CYi 4 Y + dZ, Te— Er [E2] 


dans lequel Y,, et Ÿ:, sont des variables endogènes et Z, une variable exogène. 
1) Mettre ce système sous forme matricielle et étudier les conditions d’identifiabilité. 
2) Vérifier les conditions d’identifiabilité à partir du calcul matriciel. 


3) Répondre aux mêmes questions avec e = 0. 


Solution 


1) Le modèle sous forme matricielle s’écrit : 


1 a Yi 0 b Zi Er ; 
Le AE e U, En ds SE £ 
avec U — vecteur unité. 


Nous avons g — 2 variables endogènes : Y1,, Y2, et k — 2 variables exogènes Z, et 
U. Examinons les conditions d’identifiabilité : 


— pour l'équation [E1] : gl—2;; k'=1 et r =0 soit 
g—g'+k-k +r=1=8g—1,léquation [El] est juste identifiée ; 


— pour l'équation [E2] : pr =2 k'=2 et r =0 soit 
g—g'+k—k +r =0<g—1,léquation [E2] est sous-identifiée. 


2) Par le calcul matriciel, nous allons exprimer les variables endogènes par les variables 
exogènes : Y =—B ICX+B le. 


Posons À = —B-!C 


1 1 —a —1 —ad  b—ae 
BB! — À = — 
|: + | d || 


Cette matrice À correspond à la matrice des coefficients estimés (notés @;) de la 
forme réduite. 


Nous avons donc la relation BA = —C : 
1 a se @ C2 Fu 0 b 
[o 1) CA CA = d e 
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soit en explicitant cette relation matricielle : 


@ + a@3 = 0 [E3] cœi ES CA = —d [E5] 
CA + aa = —b [Ed] Co TT CA — —€ [E6] 


Les équations [E3] et [E4] constituent deux équations à deux inconnues. Les coefficients 
a et b sont donc parfaitement identifiables dès lors que l’on connaît les coefficients de la 
forme réduite. Ces deux coefficients a et b appartiennent à l’équation [E1] qui est juste 
identifiée, ce qui est une vérification des règles énoncées. 


En revanche, les équations [ES] et [E6] forment deux équations à trois inconnues, 
soit un système indéterminé. L’équation [E3] est bien sous-identifiée. 


3) Si e — 0, l’équation [E1] reste juste identifiée et l’équation [E2] devient, dès lors, 
juste identifiée. Matriciellement, le système s’écrit : 


1 a & & 1 > E 0 b 
C 1 CA CA _ d 0 


Soit, en explicitant cette relation matricielle : 


@ + a@3 = 0 [E7] cœi TT CA = —d [E9] 
CA + as = —b [E8] CO) TT CA = 0 [E10] 


Soit quatre équations à quatre inconnues, le système est maintenant parfaitement 
déterminé. 


Exercice n° 3 


+, fichier C8EX3 
Le modèle de Klein 


Ce modèle! macro-économique fournit un excellent exemple pédagogique des pro- 
blèmes qui peuvent se poser dans le cadre des équations simultanées. 


Soit le modèle suivant : 


Cons, = ao + a P, + a2P,-1 + a3(W, + W) + er [El] 
Li = bo +b1l, + b2P-1 + b3Ki-1 + ex [E2] 
W, = co + ciX5 + CoXi 1 + Cst + Ey [E3] 
X, = Cons, + 1, +G; [E4] 
P,=X,;-W, — Tax, [ES] 
K;= 1 + Ki: [E6] 

avec : 

Cons, = consommation pour l’année f ; 

P, = profits de l’année fr ; 

W, et W' = salaires de l’année f versés par l’industrie et l’administration ; 

1, = investissements de l’année f ; 


1. Klein L. R., 1950. 
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K, = stock de capital à la fin de l’année r'; 


X, = production industrielle de l’année f ; 
G; = dépenses publiques de l’année f ; 
Tax, = impôts sur les profits de l’année f. 


1) Distinguer les variables endogènes et exogènes. 

2) Estimer les équations par la méthode des MCO. 

3) Examiner les conditions d’identifiabilité de ce modèle. 
4) Estimer ce modèle à l’aide d’une méthode adéquate. 


Les données — exprimées dans des unités convenablement choisies — sont présentées 
sur le tableau 3. 


Tableau 3 — Données du modèle de Klein (1950) (extrait des données) 


Const, G; 1, K;_: P, Tax, W, W' X; 


1920 39,8 2,4 2,7 | 180,1 | 12,7 3,4 28,8 2,2 44,9 
1921 41,9 3,9 —0,2 | 182,8 | 12,4 7,7 25,5 2,7 45,6 
1940 65,0 7,4 3,3 | 201,2 | 21,1 9,6 45,0 8,0 1557 
1941 69,7 | 13,8 4,9 | 204,5 | 23,5 11,6 53,3 8,5 88,4 


(NB : ce tableau indique directement la variable K;,_1) 


Solution 


1) Ce modèle comporte six équations et onze variables économiques (y compris le vec- 
teur et la tendance). Les trois dernières équations sont des identités (aucun paramètre 
n’est à estimer). 

Les variables exogènes sont les variables non expliquées par une relation : 
— les variables retardées : P,_,, X,_:, K,_, et 
— les variables « véritablement exogènes » : la tendance f, les dépenses gouverne- 
mentales G,, les salaires des administrations W7, les impôts sur les profits Tax, et 
le vecteur unité U. Soit, k = 8. 
Les variables endogènes sont celles qui sont déterminées par une relation de com- 
portement : Const,, 1,, W,. En ce qui concerne les identités, on choisit comme variables 
endogènes, compte tenu de leur signification, X,, P, et K,. Soit g — 6. 


Nous remarquons que, dans ce choix de variables endogènes et exogènes, la réflexion 
économique joue un grand rôle. Néanmoins, il subsiste une part d’arbitraire représenta- 
tive du schéma de pensée de l’économiste. 


2) Les estimations par les MCO sont les suivantes : 


Const, = 16,23 + 0,193 P, + 0,089 P,_; + 0,796(W, + W7) + er [E7] 
(12,4) (2,11) (0,99) (19,9) 
R? = 0,98 n =21 DW = 1,36 () = 1 de Student 
1, = 10,12 +0,479 P, + 0,333 P,_1 — 0,111 K,_1 +ex [E8] 
(1,85) (4,93) (3,30) (4,189) 
R?2 = 0,93 n =21 DW = 1,81 () = 1 de Student 
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W, = —0,066 + 0,439 X, + 0,146 X,_1 +0,13r+ez [E9] 
(202) (13,5) (3,90) (4,90) 
R? = 0,98 n =21 DW = 1,95 (-) = t de Student 


Les estimateurs des MCO sont biaisés, cette méthode d’estimation est donc inappro- 
priée pour ce type de modèle. Nous devons étudier les conditions d’identification de ce 
modèle et utiliser, le cas échéant, la méthode des DMC. 


3) Les conditions d’identification — conditions d’ordre — s’étudient équation par équa- 
tion. 


Le modèle comporte g = 6 variables endogènes et k = 8 variables exogènes (cf. la 
réponse à la question 1). 


Pour l’équation [E1], nous avons g” = 3, variables endogènes présentes et 4’ = 3, 
variables exogènes présentes, soit (g — g’ + k — k' = 8) restrictions d’exclusion. De 
plus, l’égalité entre le coefficient de W, et W} introduit une restriction supplémentaire 
r =. 


g—g'+k-k'+r=9>g—-1—=5— l'équation [El] est sur-identifiée. 
Pour l’équation [E2] : g' = 2,k' =3 et r = 0 soit: 
g—g'+k-k'+r=9>g-1—-S5,léquation [E2]est sur-identifiée. 
Pour l’équation [E3] : g’ =2,k' =3 et r = 0 soit : 
g—g'+k-k'+r=9>8g—-1—=5, l'équation [E3] est sur-identifiée. 


Les équations étant toutes sur-identifiées, il est licite d’estimer les coefficients de ce 
modèle à l’aide de la méthode des DMC. 


4) Nous avons appliqué la méthode des DMC pour chacune des trois équations à estimer 
de trois manières différentes. 


+ Équation [EI] en décomposant la méthode des DMC. 


Les variables endogènes P, et W, apparaissent à droite de l’équation ; il convient 
donc de les remplacer par leurs valeurs en fonction des 8 variables exogènes. 


Étape 1 : estimation du modèle pour P, et calcul de la variable ajustée PA,. 
Dependent Variable : P 


Sample (adjusted): 1921 1941 
Included observations: 21 after adjusting endpoints 


Variable Coefficient Std. Error t-Statistic Prob. 
C 46.55153 23.15829 2.010145 0.0656 
P(-1) 0.802501 0.518856 1.546674 0.1459 
K — 0.216103 0.119113 — 1.814267 0.0928 
X(-1) 0.022000 0.282164 0.077969 0.9390 
WP — 0.079608 2.533823 — 0.031418 0.9754 
TREND 0.319405 0.778129 0.410478 0.6881 
G 0.439016 0.391143 1.122394 0.2820 
TAX — 0.923098 0.433759 — 2.128133 0.0530 
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Étape 2 : estimation pour W, et calcul de la variable ajustée WA,. 


Dependent Variable : W 


Sample (adjusted): 1921 1941 
Included observations: 21 after adjusting endpoints 


Variable Coefficient Std. Error t-Statistic Prob. 
C 34.87254 18.61034 1.873826 0.0836 
P(-1) 0.871921 0.416960 2.091137 0.0567 
K — 0.122952 0.095721 — 1.284477 0.2214 
X(-1) 0.095329 0.226751 0.420412 0.6811 
WP — 0.443726 2.036218 — 0.217917 0.8309 
TREND 0.713584 0.625316 1.141158 0.2744 
G 0.866220 0.314328 2.755783 0.0164 
TAX — 0.60415 0.348575 -1.733206 0.1067 


Étape 3 : estimation du modèle final en remplaçant dans l’équation [1] P, par PA, et 
W, par WA. 


Dependent Variable : CONS 
Sample (adjusted): 1921 1941 
Included observations: 21 after adjusting 


Variable Coefficient Std. Error t-Statistic Prob. 
C 16.55476 2.571080 6.438834 0.0000 
PA 0.017302 0.229797 0.075294 0.9409 
P(-1) 0.216234 0.208810 1.035554 0.3149 
WA + WP 0.810183 0.078351 10.34044 0.0000 


+ Équation [E2] par application directe de la méthode des DMC à l’aide de Eviews, 
l'instruction unique est la suivante (la liste des instruments — les variables exogènes — 
figurent après @ : 


TSLS I C P(-1) K P @ C P(-1) K X(-1) WP TREND G TAX 


Dependent Variable : I 

Method: Two-Stage Least Squares 

Sample (adjusted): 1921 1941 

Included observations: 21 after adjusting endpoints 
Instrument list: C P(-1) K X(-1) WP TREND G TAX 


Variable Coefficient Std. Error t-Statistic Prob. 
C 20.27821 8.383247 2.418897 0.0271 
P(-1) 0.615943 0.180926 3.404398 0.0034 
K — 0.157788 0.040152 — 3.929752 0.0011 
P 0.150222 0.192534 0.780238 0.4460 
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+ Équation [E3] par application directe de la méthode des DMC à l’aide de RATS, 
les instructions sont les suivantes : 


INSTRUMENTS CONSTANT TREND WP TAX GP{1}KX{1} 
LINREG(INST) W 
# CONSTANT TREND X{1} X 


Dependent Variable W — Estimation by Instrumental Variables 
Annual Data From 1921: 01 To 1941: 01 
Usable observations 21 Degrees of Freedom 17 


Centered R**2 0.987414 R Bar **2 0.985193 
Variable Coeff Std Error T-Stat Signif 
1. Constant — 0.064451360 1.147038221 — 0.05619 0.95584607 
2. TREND 0.130395687 0.032388389 4.02600  0.00087642 
3.X{1} 0.146673821 0.043163948 3.39806  0.00342209 
4. X 0.438859065 0.039602662 11.08155 0.00000000 


Nous pouvons aussi appliquer la méthode des triples moindres carrés. Le système 
(SYS01) s’écrit : 


cons = C(1) + C(2) x P + C(3) x P(- 1) + C(4) x (W + WP) 
I = C(5) + C(6) x P + C(7) x P(- 1) + C(8) x K 
W = C(9) + C(10) x X + C(11) x X(- 1) + C(12) x @trend(1919) 
inst C @trend(1919) WP TAX G P(- 1) K X(- 1) 
Les résultats (SYSO1.3SLS) sont les suivants : 


System : SYSOI 

Estimation Method : Three-Stage Least Squares 
Sample : 1921 1941 

Included observations : 21 

Total system (balanced) observations 63 


Coefficient Std Error t-Statistic Prob. 
C(1) 16.44079 1.304549 12.60267 0.0000 
C2) 0.124891 0.108129 1.155014 0.2535 
CG) 0.163144 0.100438 1.624322 0.1105 
C(d) 0.790081 0.037938 20.82563 0.0000 
C(S) 28.17784 6.793769 4.147601 0.0001 
C(6) — 0.013079 0.161896 —0.080786 0.9359 
C(7) 0.755724 0.152933 4.941532 0.0000 
C(8) — 0.194848 0.032531 — 5.98974 0.0000 
C(9) 0.001128 1.009957 0.001117 0.9991 
C(10) 0.400492 0.031813 12.58878 0.0000 
C(1) 0.181291 0.034159 5.307308 0.0000 
C(12) 0.149674 0.027935 5.357897 0.0000 


Equation : CONS = C(1) + C(2) x P + C(3) x P(- 1) + C(4) x (W + WP) 
Equation : 1= C(5) + C(6) x P + C(7) x P(- 1) + C(8) x K 

Equation : W = C(9) + C(10) x X + C(11) x X(- 1}+C(12) x @TREND(1919) 
Instruments : C @TREND(1919) WP TAX GPC DKX(C 1) 


234 e ÉCONOMÉTRIE 


Enfin la méthode du maximum de vraisemblance à information complète (SYSO01.fiml) 
permet d’obtenir les résultats suivants : 


System : SYSOI 

Estimation Method : Full Information Maximum Likelihood (Marquardt) 
Sample : 1921 1941 

Included observations : 21 

Total system (balanced) observations 63 


Coefficient Std Error z-Statistic Prob. 
C() 15.83050 4.095952 3.864913 0.0001 
CC) 0.300548 0.408091 0.736472 0.4614 
CG) 0.042528 0.164388 0.258707 0.7959 
C(4) 0.780851 0.078507 9.946226 0.0000 
C(S) 15.70774 14.35232 1.094439 0.2738 
C(6) 0.382189 0.341696 1.118507 0.2634 
C(7) 0.409626 0.248385 1.649155 0.0991 
C(8) — 0.137683 0.071215 — 1.933357 0.0532 
C(9) — 0.136911 4.099237 — 0.033399 0.9734 
C(10) 0.370767 0.129208 2.869534 0.0041 
C(1) 0.207299 0.090622 2.287518 0.0222 
C(12) 0.184379 0.101556 1.815549 0.0694 


Equation : CONS = C(1) + C(2) x P + C(3) x P(- 1) + C(4) x (W + WP) 


Equation : I = C(5) + C(6) x P + C(7) x P(- 1) + C(8) x K 


Equation : W = C(9) + C(10) x X + C(11) x X(- 1) + C(12) x @TREND(1919) 
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Annexe 


dentification : les conditions de rang 


Soit le modèle sous forme matricielle : 


B Y + C X = 
(8,8) (8,1) (gk) (1) (g,1) 


On appelle P la matrice des structures qui est formée par la juxtaposition des 
matrices B et C, soit P = [BC], P est donc de dimension (g,g + k). 


Soit d;, une matrice des restriction afférente à l’équation { construite telle que : 
Pibin = 0, i est la i-ième ligne de la matrice P et h la h-ième colonne de la matrice 


di. 


Soit u; = rang[ P@;] (rang de la matrice P;), et g le nombre de variables endo- 
gènes du modèle, la condition de rang est alors la suivante : 


— Si; < g — 1 — l’équation i est sous-identifiée ; 
— Si dj = g — 1 — l’équation i est juste identifiée ; 
— Sidi > g — 1 — l'équation i est sur-identifiée. 


Cette condition nécessaire et suffisante d’identification est, bien entendu, plus lour- 


de à mettre en œuvre, c’est pourquoi le plus souvent on se satisfait des conditions 
d’ordre. 


À partir du modèle de l’exercice 1, nous allons construire ces matrices et appliquer 
les conditions de rang. 


Ce modèle sous forme matricielle s’écrit : 


SERIES 


B Xe Ye C x X = -£ 
Das = 
Soit P = [BC] = ee : : 2e 


La matrice D, matrice des restrictions de la première équation, est donc construite 
de la manière suivante : 


— autant de lignes que de variables endogènes et exogènes, chaque ligne est repré- 
sentative d’une variable (ligne 1 = Y,,, ligne 2 = Y:,, ligne 3 = X,,, ligne 
4 = Yi); 


— une colonne par restriction d’exclusion (variable endogène ou exogène manquan- 
te) et par restriction linéaire sur les coefficients ; 


— pour les relations d’exclusion, les colonnes sont composées de 0, sauf pour les 
variables dont le coefficient est nul où l’on met la valeur 1 ; 
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— pour les restrictions de contraintes sur les coefficients, on explicite la relation entre 
les coefficients. Dans notre modèle, nous avons ci, — C2 = 0 (Y, et X; ont le 
même coefficient). 


Nous pouvons alors récrire la condition : P;h;n = 0. 


Soit, pour l’équation 1, nous avons une seule variable manquante et une restriction 
sur le coefficient des variables Y, et X, qui doit être identique, soit deux colonnes : 


0 0 

0 1 — 
di = 0 “| | ve les variables Y, et X, ont le même coefficient 

1 


la variable Y,,_. est absente 


Pour ® , nous avons une seule restriction : la variable X, est absente de l’équation 
2, soit : 


1 —a —a 0 0 1 0 0 
rn=|., 1 0 4 0 2 | 


rang de Phi = 1 = g—-1. 


L’équation 1 est juste identifiée. 


CIE 
0 — rang de Ph = =1=g—-1 


L’équation 2 est juste identifiée (sauf si a = 0). 


Nous remarquons que la condition de rang vient modifier la condition d’ordre de la 
première équation, puisque d’un statut de sur-identifiée, elle devient juste identifiée. 
Toutefois, cela ne remet aucunement en cause les résultats trouvés lors de l’exercice 1. 
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léments d'analyse 
des séries temporelles 


e chapitre est consacré à une présentation sommaire des tech- 

niques d'analyse des séries chronologiques. Ce thème, à lui seul, 

peut faire l'objet de longs développements et de nombreux 
ouvrages! y sont intégralement consacrés. Nous étudions en I. les carac- 
téristiques statistiques - en terme de stationnarité - des séries tempo- 
relles en présentant les différents tests (Dickey-Fuller, corrélogramme, 
etc.) s'y rapportant. Puis en Il. nous présentons différentes classes de 
modèles (AR, MA, ARMA) en étudiant leurs propriétés. Enfin, la métho- 
de Box et Jenkins qui systématise une démarche d'analyse des séries tem- 
porelles fait l'objet de la section III. 


tationnarité 


éfinition et propriétés 


Avant le traitement d’une série chronologique, il convient d’en étudier les carac- 
téristiques stochastiques. Si ces caractéristiques — c’est-à-dire son espérance et 
sa variance — se trouvent modifiées dans le temps, la série chronologique est 
considérée comme non stationnaire ; dans le cas d’un processus stochastique 
invariant, la série temporelle est alors stationnaire. De manière formalisée, le 
processus stochastique y, est stationnaire si : 


1. Pour un approndissement de ce chapitre, se référer au livre de Bourbonnaïis KR. et Terraza M. 
Dunod, 2010. 
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E(y) = E(y:») = u Vt et Vm, la moyenne est constante et indépendante du 
temps ; 
var(y,) < oo Vf, la variance est finie et indépendante du temps ; 


COV( y, Ya) = E[(y — 4)(rx — u)]= x, la covariance est indépendante du 
temps. 


Il apparaît, à partir de ces propriétés, qu’un processus de bruit blanc! &, dans 
lequel les &, sont indépendants et de même loi N(0,0?) est stationnaire. 


Une série chronologique est donc stationnaire si elle est la réalisation d’un 
processus stationnaire?. Ceci implique que la série ne comporte ni tendance, ni 
saisonnalité et plus généralement aucun facteur n’évoluant avec le temps. 


onctions d'autocorrélation simple et partielle 


La fonction d’autocorrélation (FAC) est la fonction notée », qui mesure la cor- 
rélation de la série avec elle-même décalée de k périodes, comme l’illustre le 
tableau 1. 


Sa formulation est la suivante : 


» Or — )Orx — y) 


COV(Y:, rx) . t=k+1 


Lo Do-n JS Ga 


1=k+1 t=k+1 


k = 


[1] 


OT 


avec y moyenne de la série calculée sur n — k périodes, n = nombre d’observations. 
Nous pouvons en déduire que : 
Po=l et P—=p4 
Cette formule [1] est malaisée à manier puisqu'elle exige de recalculer pour 


chaque terme p, les moyennes et les variances, c’est pourquoi on lui préfère la 
fonction d’autocorrélation d’échantillonnage : 


D G-DOE- 7) 


= t=k+1 
> G-» 
t=1l 


avec y moyenne de la série calculée sur n périodes. 


[2] 


D 
Cu 
| 


1. Un processus de bruit blanc est une suite de variables aléatoires de même distribution et mutuel- 
lement indépendantes. Ce terme est emprunté à la physique faisant référence au spectre de la 
lumière blanche. 

2. Si les conditions énoncées ci-dessous sont vérifiées, on dit que la série est stationnaire de second 
ordre, ou encore faiblement stationnaire. Dans le cas où, aux conditions définies, s’ajoute la 
constante de la distribution de probabilité, on parle de série strictement stationnaire. 
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Tableau 1 — Exemple de calcul d’une fonction d’autocorrélation 


k 0 1 2 3 4 

Î Y Yr-1 Vr-2 Vr-3 ra 

1 123 

2 130 123 

3 125 130 123 

4 138 125 130 123 

5 145 138 125 130 123 

6 142 145 138 125 130 

si 141 142 145 138 125 

8 146 141 142 145 138 

9 147 146 141 142 145 

10 157 147 146 141 142 

11 150 157 147 146 141 

12 145 150 157 147 146 
Moyenne y, 140,75 | 142,36 | 143,60 145,67 | 146,63 
Moyenne y, |140,75 | 140,36 | 139,40 | 137,44 | 136,25 
Variance y, 95,02 72,41 62,84 24,11 22,23 
Variance y;_4 95,02 | 101,87 | 101,84 74,91 71,44 

Px 1 0,77 0,62 0,59 0,55 


Lorsque le nombre d’observations n est suffisamment grand, les deux for- 
mules [1] et [2] donnent des résultats très proches. 


La fonction d’autocorrélation partielle (FAP) s’apparente à la notion de cor- 
rélation partielle. Nous avons défini au chapitre 4 le coefficient de corrélation 
partielle comme étant le calcul de l’influence de x, sur x, en éliminant les 
influences des autres variables x3, x4, ..., xx. 


Par analogie, nous pouvons définir l’autocorrélation partielle de retard k 
comme le coefficient de corrélation partielle entre y, et y,_,, c’est-à-dire comme 
étant la corrélation entre y, et y, l’influence des autres variables décalées de k 
périodes (y:_1, ÿ:_2, ..., Yu) ayant été retirée. 


Afin d’éviter par la suite toutes ambiguïtés entre les deux fonctions d’auto- 
corrélation, nous appelons fonction d’autocorrélation simple, la fonction d’auto- 
corrélation. 


ests de « bruit blanc » et de stationnarité 


Nous ne pouvons identifier clairement les caractéristiques stochastiques d’une 
série chronologique que si elle est stationnaire. Cette étude de stationnarité 
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s’effectue essentiellement à partir de l’étude des fonctions d’autocorrélation (ou 
de leur représentation graphique appelée « corrélogramme >»). Une série chro- 
nologique est stationnaire si elle ne comporte ni tendance ni saisonnalité. Nous 
allons donc, à partir de l’étude du corrélogramme d’une série, essayer de mon- 
trer de quelle manière nous pouvons mettre en évidence ces deux composantes. 


Nous pouvons distinguer différents types de séries stationnaires : 


— à mémoire, c’est-à-dire dont on peut modéliser, par une loi de reproduc- 
tion, le processus ; 


— identiquement et indépendamment distribuée notée i.i.d. ou appelée Bruit 
Blanc (« White Noise ») ; 


— normalement (selon une loi normale) et indépendamment distribuée notée 
n.i.d. ou appelée Bruit Blanc gaussien. 


1) Analyse des fonctions d'autocorrélation 


Lorsque nous étudions la fonction d’autocorrélation d’une série chronologique, 
la question qui se pose est de savoir quels sont les termes », qui sont significa- 
tivement différents de 0. 


En effet, par exemple, si aucun terme n’est significativement différent de O, 
on peut en conclure que le processus étudié est sans mémoire et donc qu’à ce 
titre il n’est affecté ni de tendance ni de saisonnalité. Ou encore si une série men- 
suelle présente une valeur élevée pour v,, (corrélation entre y, et y,_12), la série 
étudiée est certainement affectée d’un mouvement saisonnier!. Nous verrons à 
partir d’exemples différents cas de figures. 


Le test d’hypothèses pour un terme », est le suivant : 
HO : Pr = 0 
H1:æ2Æ0 
Nous pouvons utiliser le test d’hypothèses d’un coefficient de corrélation, 
présenté au chapitre 1, fondé sur la comparaison d’un f de Student empirique et 
théorique. Toutefois, Quenouille? a démontré que pour un échantillon de taille 


importante (n7 > 30), le coefficient », tend de manière asymptotique vers une loi 
normale de moyenne 0 et d’écart type 1//n. 


L’intervalle de confiance du coefficient », est alors donné par : 


a/2 il 
n 


D =0+t 


n = nombre d’observations. 


1. Il s’agit même d’un test de détection de saisonnalité. 
2. Quenouille M. H., 1949. 
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Si le coefficient calculé 9, est à l’extérieur de cet intervalle de confiance, il 
est significativement différent de O au seuil « (en général œ =0,05 et 
1/2 = 1,96). La plupart des logiciels fournissent, avec le corrélogramme, l’in- 
tervalle de confiance, ce qui autorise une interprétation instantanée. 


Nous devons souligner une limite des tests à 5 %. En effet, lorsqu’une fonc- 
tion d’autocorrélation est calculée pour un nombre important de retards, nous 
pouvons nous attendre à ce que quelques-uns soient, de manière fortuite, signi- 
ficativement différents de 0. Si h est le nombre de retards, le nombre possible de 
faux rejets est alors de 0,05 x h, pour un seuil de confiance de 5 %. 


Dans le cas où le corrélogramme ne laisse apparaître aucune décroissance de 
ses termes (absence de « cut off >), nous pouvons en conclure que la série n’est 
pas stationnaire en tendance. 


2) Statistiques de Box-Pierce et Ljung-Box 


Le test de Box-Pierce permet d’identifier les processus sans mémoire (suite de 
variables aléatoires indépendantes entre elles). Nous devons donc identifier 
cov(y,,7,_) = 0 ou encore 9; = 0 VK. 


Un processus de bruit blanc implique que p, = p, =... = p, = 0, soit les 
hypothèses : 
HO LD ==... py =0 


H1 : il existe au moins un », significativement différent de 0. 


Pour effectuer ce test, on recourt à la statistique Q (due à Box-Pierce!) qui 
est donnée par : 


h 
Q=n) 8 
k=1 


h = nombre de retards, 5, = autocorrélation empirique d’ordre k, n = nombre 
d'observations. 


La statistique Q est distribuée de manière asymptotique comme un x? (chi- 
deux) à h degrés de liberté. Nous rejetons donc l’hypothèse de bruit blanc, au 
seuil æ, si la statistique Q est supérieure au x? lu dans la table au seuil (1 — ) 
et h degrés de liberté. 


Nous pouvons utiliser aussi une autre statistique, dont les propriétés asymp- 
totiques sont meilleures, dérivée de la première qui est le Q’ de Ljung et Box’ : 


h + 
Q'=nm+D) 
k=1 


De 
té et dont les règles de décisions sont identiques au précédent. Ces tests sont 
appelés par les anglo-saxons : « portmanteau test» soit littéralement test 
« fourre-tout ». 


qui est aussi distribuée selon un x? à h degrés de liber- 
n 


1. Box GE. P. et Pierce D. A., 1970. 
2. Ljung G. M. et Box G E. P., 1978. 
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3) Tests de normalité 


Pour calculer des intervalles de confiance prévisionnels et aussi pour effectuer 
les tests de Student sur les paramètres, 1l convient de vérifier la normalité des 
erreurs. Le test de Jarque et Bera (1984), fondé sur la notion de Skewness (asy- 
métrie) et de Kurtosis (aplatissement), permet de vérifier la normalité d’une dis- 
tribution statistique. 


a) Les tests du Skewness et du Kurtosis 


. 1€ : h à 
Soit Uy = — he — x)! le moment centré d’ordre k, le coefficient de Skewness 
n i=1 
W3 


(B;”) est égal à : Bi” = as él le coefficient de Kurtosis : B; = —. 


2 
M 2 


S1 la distribution est normale et le nombre d’observations grand (n > 30) : 


EE” "(0 12) et B> — "(5 =) 


On construit alors les statistiques : 
1/2 
870, _ lBæ=—3 


= —— et 


FE : [24 
4) 4) 


male au seuil de 5 %). 


que l’on compare à 1,96 (valeur de la loi nor- 


Si les hypothèses HO : », = 0 (symétrie) et v, = 0 (aplatissement normal) 
sont vérifiées, alors », < 1,96 et », < 1,96 ; dans le cas contraire, l’hypothèse de 
normalité est rejetée. 


b) Le test de Jarque et Bera 


Il s’agit d’un test qui synthétise les résultats précédents ; si Bj/° et B, obéissent 
à des lois normales alors la quantité s : s — 6 Bi + 54 À — 3)? suit un x? à deux 
degrés de liberté. 


Donc si s > x?,(2), on rejette l'hypothèse HO de normalité des résidus au 
seuil «. 


Ces tests de normalité servent également dans le cas où il y a hétéroscédaci- 
té. En effet, l’hétéroscédacité se manifeste sur le graphe de la distribution par 
des queues de probabilité plus épaisses (distribution leptokurtique) que les 
queues de la loi normale. 


4) Tests d'homoscédasticité 


Un processus de bruit blanc doit être homoscédastique, les tests d’hétéroscédas- 
ticité du chapitre 5, Section II peuvent être utilisés. 


244 e ÉCONOMÉTRIE 


— Le test de Goldfeld-Quandt a pour but de comparer la somme des carrés 
des résidus d’estimation après avoir scindé les résidus en deux sous-échan- 
üllons. 

— Un autre test consiste à étudier la distribution des carrés des résidus. 
L'analyse des termes du corrélogramme des résidus au carré permet de tes- 
ter l’existence d’une hétéroscédacité. Si certaines valeurs de la FAC (tests 
de Box-Pierce ou Ljung-Box) sont significativement différentes de 0, nous 
pouvons conclure à la présence d’une hétéroscédacité. 


a non-stationnarité et les tests de racine 
unitaire 


a non-stationnarité : les processus TS et DS 


Les chroniques économiques sont rarement des réalisations de processus aléa- 
toires stationnaires. Pour analyser la non-stationnarité, deux types de processus 
sont distingués : 
— les processus TS (Trend Stationary) qui représentent une non-stationnarité 
de type déterministe! ; 


— les processus DS (Differency Stationary) pour les processus non station- 
naires aléatoires. 


a) Les processus TS 


Un processus TS s'écrit : x, = f, +, où f, est une fonction polynômiale du 
temps, linéaire ou non linéaire, et &, un processus stationnaire. Le processus TS 
le plus simple (et le plus répandu) est représenté par une fonction polynômiale 
de degré 1. Le processus TS porte alors le nom de linéaire et s’écrit : 

X = d +at+E,. 


S1 €, est un bruit blanc (gaussien ou non), les caractéristiques de ce proces- 
sus sont alors : 


Ex] = à + ait + Ele,] = ao + ait 


VIx] = 0+ Ve,] = 0? 
cov{x,,xy] = 0 pour t £ f 


Ce processus TS est non stationnaire car Efx,] dépend du temps. 
Connaissant & et &, le processus x, peut être stationnarisé en retranchant, de la 
valeur de x, en f, la valeur estimée à, + ar. Dans ce type de modélisation, l’ef- 


1. Par définition, un processus est aléatoire d’où l’ambiguïté du terme de processus déterministe. 
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fet produit par un choc (ou par plusieurs chocs aléatoires) à un instant f est tran- 
sitoire. Le modèle étant déterministe, la chronique retrouve son mouvement de 
long terme qui est ici la droite de tendance. Il est possible de généraliser cet 
exemple à des fonctions polynômiales de degré quelconque. 


b) Les processus DS 


Les processus DS sont des processus que l’on peut rendre stationnaires par l’uti- 
lisation d’un filtre aux différences : (1 — D)x, = B +e, où &, est un processus 
stationnaire, 8 une constante réelle, D l’opérateur décalage et d l’ordre du filtre 
aux différences. 


Ces processus sont souvent représentés en utilisant le filtre aux différences pre- 
mières (d = 1). Le processus est dit alors processus du premier ordre. Il s’écrit : 


A—-D)x =B+e S x =x ;+B+e, 
L'introduction de la constante B dans le processus DS permet de définir deux 
processus différents : 
+ B = 0 : le processus DS est dit sans dérive. 
Il s’écrit : x, = x,_, +&,. 


Comme &, est un bruit blanc, ce processus DS porte le nom de modèle de 
marche au hasard ou de marche aléatoire (Random Walk Model). Il est très fré- 
quemment utilisé pour analyser l’efficience des marchés financiers. 


Pour étudier les caractéristiques de ce modèle, écrivons-le sous sa forme 
développée : 


Xe = Xi + & 


Xi = Xi À Es 7 Xs = Xi2 À Es À Er 
X2 = Xi + Es > Xs = Xi-3 + Es 2 + Es + E 
etc. 


Si le premier terme de la chronique est x, le modèle s’écrit alors : 


Lt 
Xi = Xo + ) Ei 
i=l 


Les caractéristiques de ce processus sont (en supposant x, certain) : 


Elx] = x 
VIx,] = 102 
cov{x,,x/] = 6? x Min(r,r”) sit 1’ 


Par exemple : 


COV(X4,X2) = ET(xo + E1 + E2 + €3 + €4) (0 + E1 + &2)] 
= E(e, x &1) + E(e X &2) = 202. 


[4 


En effet tous les produits E(e, x €) = 0 sit £ t. 
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Ce processus est non stationnaire en variance puisqu'elle dépend du temps. 
Cette non stationnarité est dite aléatoire ou stochastique. 


Pour stationnariser la marche aléatoire, il suffit d'appliquer au processus le 
filtre aux différences premières : x, = x, +6, & (1 — Djx, — &,. 


°B Z 0 : le processus porte alors le nom de processus DS avec dérive. 

I s'écrit: x, = x, + B+e,. 

Comme précédemment, on peut rechercher sa forme équivalente développée : 
X = Xi +B+E, 


Xi = ko tB+ei x = x +2B+e te, 
Xi = Xi +B+E > X = Xi: +3B+e 2+e i+e, 
etc. 


Si on suppose la valeur d’origine x, connue et déterministe, on a alors : 
Lt 
X, = Xo + Bt + ) E; 
i=1 
On peut analyser les caractéristiques de ce processus : 


Efx;] = x + Bt 
V[x;] = 10? 
cov{x,,x] = 06? x Min(s,r') sit & t 
Le processus est non stationnaire de par son espérance et sa variance. 


L’espérance étant de la même forme que celle d’un processus TS, on reconnaît 
dans ce processus une non stationnarité déterministe et aléatoire à la fois. 


La stationnarisation de ce processus est réalisée en utilisant le filtre aux dif- 
férences premières : 


X=xnu+B+e & (1—B)x =B+E, 


Soit en employant la forme développée : 


t—1 


X = Xo + Bt + de et en calculant : x;_1 = xo + Bt — 1) + ds 


i=] i=1 


Ona:x, —x_; = (1— Bx, = B+e,. 


Dans les processus de type DS, un choc à un instant donné se répercute à 
l'infini sur les valeurs futures de la série ; l’effet du choc est donc permanent et 
va en décroissant. 


En résumé, pour stationnariser un processus TS, la bonne méthode est celle 
des moindres carrés ordinaires ; pour un processus DS, il faut employer le filtre 
aux différences. Le choix d’un processus DS ou TS comme structure de la chro- 
nique n’est donc pas neutre. 
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c) Conséquences d’une mauvaise stationnarisation du processus 


Pour un processus TS, la bonne méthode de stationnarisation est celle des 
moindres carrés ordinaires. Supposons que l'on applique au processus TS du pre- 
mier ordre un filtre aux différences premières. À priori, comme le degré du poly- 
nôme est 1, ce filtre peut être considéré comme correct puisqu'un filtre aux dif- 
férences d'ordre d élimine un polynôme de même degré. Cependant, on démontre 
que l'application du filtre aux différences a créé une perturbation artificielle. 


Pour un processus DS, la bonne méthode de stationnarisation est le filtre aux 
différences premières. Supposons que l'on applique la méthode des moindres 
carrés ordinaires (régression sur le temps) sur les observations d'un échantillon 
du processus, les paramètres de la tendance sont estimés et par conséquent le 
résidu de la régression doit être un bruit blanc. Nelson et Kang montrent à par- 
tir de simulations, que l'élimination d'une tendance linéaire sur un processus de 
marche aléatoire crée artificiellement une forte autocorrélation des résidus pour 
les premiers retards. 


Sur le plan économétrique, il est donc primordial d'identifier clairement le 
processus sous-jacent et d'employer la méthode adéquate de stationnarisation. 
Sinon le risque de créer des « bruits parasites » artificiels est très élevé. 


Les conséquences sont également importantes sur le plan économique. 
Considérons, par exemple, le PIB d'un pays comme la France en valeur réelle. 
Si ce PIB est DS plutôt que TS, il est alors nécessaire de remettre en cause la 
décomposition traditionnelle (tendance et cycle) et sa justification théorique : 
l'indépendance des schémas explicatifs. Si le PIB est en effet DS, la croissance 
et le cycle sont liés et ne peuvent être en conséquence étudiés de façon séparés. 
Or, d'après les travaux de Nelson et Plosser (1982) sur des chroniques macro- 
économiques américaines, la variabilité constatée de la composante conjonctu- 
relle serait due à une structure DS. Comme jusqu'à présent, l'analyse de cette 
composante s'effectue à partir du résidu d'une régression entre le PIB et une ten- 
dance déterministe, cette analyse surestime l'amplitude du cycle et sous-estime 
l'importance de la tendance. Sur ce constat, Beveridge S. et Nelson C.R. (1981) 
proposent une décomposition des processus selon une tendance stochastique 
(permanente) qui obéit à une marche aléatoire avec ou sans dérive et une com- 
posante stationnaire (transitoire). Par la suite Harvey A.C. (1988) utilise les 
modèles structurels à composantes inobservables (modèle tendance plus cycle et 
tendance-cycle) représentées sous forme d'un modèle espace d'états estimé par 
le filtre de Kalman. 


es tests de racine unitaire 
et la stratégie séquentielle de test 
Les tests de racine unitaire « Unit Root Test » permettent non seulement de 
détecter l’existence d’une non-stationnarité mais aussi de déterminer de quelle 


non-Stationnarité il s’agit (processus TS ou DS) et donc la bonne méthode pour 
stationnariser la série. 
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a) Tests de racines unitaires : tests de Dickey-Fuller (1979) 


Les tests de Dickey-Fuller (DEF) permettent de mettre en évidence le caractère 
stationnaire ou non d’une chronique par la détermination d’une tendance déter- 
ministe ou stochastique. 

Les modèles servant de base à la construction de ces tests sont au nombre de 
trois. Le principe des tests est simple : si l'hypothèse HO : @, = 1 est retenue 
dans l’un de ces trois modèles, le processus est alors non stationnaire. 


[ll x = px, 1 +e, Modèle autorégressif d’ordre 1. 
PD]1x = px; +B+e, Modèle autorégressif avec constante. 
[31x = px, +bt+c+e, Modèle autorégressif avec tendance. 


S1 l’hypothèse HO est vérifiée, la chronique x, n’est pas stationnaire quel que 
soit le modèle retenu. 


Dans le dernier modèle [3], si on accepte H1 : 9, < 1 et si le coefficient b est 
significativement différent de O, alors le processus est un processus TS ; on peut 
le rendre stationnaire en calculant les résidus par rapport à la tendance estimée 
par les moindres carrés ordinaires. 


Sous HO, les règles habituelles de l’inférence statistique ne peuvent pas être 
appliquées pour tester cette hypothèse, en particulier la distribution de Student 
du paramètre #, ; Dickey et Fuller ont donc étudié la distribution asymptotique 
de l’estimateur ÿ, sous l’hypothèse HO. À l’aide de simulations de Monte-Carlo, 
ils ont tabulé les valeurs ae pour des échantillons de tailles différentes. 
Ces tables sont des tables! analogues aux tables du f de Student. Les auteurs ont 
choisi de tester la valeur (9, — 1) au lieu de ® pour des raisons purement sta- 
tistiques. Cela n’est pas gênant pour le test. En effet, x, = Dix, 1 +e, S’écrit 
aussi : 

Xe — Xi — Pixii — Xi + & 
Xr — (@i — Lx +e, 
Il est donc équivalent de tester comme hypothèse HO : 9, = 1 ou p — 1 = 0. 
Les principes généraux du test sont les suivants. 


On estime par les moindres carrés ordinaires le paramètre @, noté h pour les 
modèles [1], [2] et [3]. L’estimation des coefficients et des écarts types du modèle 
par les moindres carrés ordinaires fournit f;, qui est analogue à la statistique de 
Student (rapport du coefficient sur son écart type). Si LG, À liabulé» alors on accep- 
te l’hypothèse HO ; il existe une racine unité, le processus n’est donc pas 
stationnaire. 


Remarque : les principaux logiciels d'analyse de séries temporelles calculent 
automatiquement les valeurs critiques f; . 


b) Les tests de Dickey et Fuller Augmentés 


Dans les modèles précédents, utilisés pour les tests de Dickey-Fuller simples, le 
processus &, est, par hypothèse, un bruit blanc. Or il n’y a aucune raison pour 


1. Cf. table 7 en fin d'ouvrage. 
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que, a priori, l'erreur soit non corrélée ; on appelle tests de Dickey-Fuller 
Augmentés (ADF, 1981) la prise en compte de cette hypothèse. 


Les tests ADF sont fondés, sous l’hypothèse alternative |d,| < 1, sur l’esti- 
mation par les MCO des trois modèles : 


Modèle [4] : Ax, = px; —Ÿ @Ax, jte, 


P 
Modèle [5] : Ax, = px;_; — D pAx-ju +c+e, 
j=2 


Modèle [6] : Ax, = px,_; — DT AXx-jn +c+bt+e, 


avec &, —> ii.d. 


Le test se déroule de manière similaire aux tests DEF simples, seules les tables 
statistiques diffèrent. La valeur de p peut être déterminée selon les critères de 
Akaike ou de Schwarz, ou encore, en partant d’une valeur suffisamment impor- 
tante de p, on estime un modèle à p — 1 retards, puis à p — 2 retards, jusqu’à ce 
que le coefficient du pièM® retard soit significatif. 


c) Le test de Phillips et Perron (1988) 


Ce test est construit sur une correction non paramétrique des statistiques de 
Dickey-Fuller pour prendre en compte des erreurs hétéroscédastiques. Il se 
déroule en quatre étapes : 


1) Estimation par les moindres carrés ordinaires des trois modèles de base 
des tests de Dickey-Fuller et calcul des statistiques associées, soit e, le résidu 
estimé. 


she ; ! sr LE 
2) Estimation de la variance dite de court terme &? = — ÿ'e? 
M 521 


3) Estimation d'un facteur correctif s? (appelé variance de long terme) établi 
à partir de la structure des covariances des résidus des modèles précédemment 
estimés de telle sorte que les transformations réalisées conduisent à des distri- 
butions identiques à celles du Dickey-Fuller standard : 
seu )lie 
"cu t tÉt-ie 
re i=1 [+1/n t=i+]l 
Pour estimer cette variance de long terme, il est nécessaire de définir un 
nombre de retards / (troncature de Newey-West) estimé en fonction du nombre 
d'observations n, ! & 4(n/100)°”. 


h —=1 k — 16; 
4) Calcul de la statistique de PP : 1* = Vk x @ ) + ne Yo 
“ CG VE 


72 

o : bras is à : ; 
avec k — 5 (qui est égal à 1 — de manière asymptotique — si e, est un bruit 
blanc). Cette statistique est à comparer aux valeurs critiques de la table de 
MacKinnon. 
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d) Stratégie de tests 


Nous constatons que pour réaliser un test de racine unitaire, le résultat n’est pas 
identique selon l’utilisation de l’un des trois modèles comme processus généra- 
teur de la chronique de départ. Les conclusions auxquelles on parvient sont donc 
différentes et peuvent entraîner des transformations erronées. C’est la raison pour 
laquelle Dickey et Fuller, et à leur suite d’autres auteurs, ont élaboré des straté- 
gies de tests!. Nous présentons un exemple simplifié (schéma 1) d’une stratégie 
de tests. Les valeurs critiques des f et r; permettant de tester la nullité des coeffi- 
cients c et b des modèles [2] et [3] sont données en fin d’ouvrage (table 7). 


e) Le test KPSS (1992) 
Kwiatkowski et al. (1992) propose d’utiliser un test du multiplicateur de 
Lagrange (LM) fondé sur l’hypothèse nulle de stationnarité. Après estimation 


des modèles [2] ou [3], on calcule la somme partielle des résidus : S, = de e; et 
i=1 
on estime la variance de long terme (s?) comme pour le test de Phillips et Perron. 


Estimation du modèle [3] 
Y=c+bt+@;iy 1+a; 
Test b = 0 


non 


Processus TS : lp, l<1 


M=C+bt+@iy,+a 


Estimation du modèle [2] 


M=C+Piy ni +a 
Test c = 0 


non 


Test®,=1 
oui 7 Non 
Processus DS Processus stationnaire 


Estimation du modèle [1] 
JÈ= PV +a; 
Test D =1 


oui non 
Processus DS Processus stationnaire 


Schéma 1 — Stratégie simplifiée des tests de racine unitaire 


oui 


1. Cf. Bourbonnaïis R. et Terraza M. Chapitre 5, 2010. 
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25 
te l 7 

La statistique est alors LM = — - — 
s? n? 

rité si cette statistique est supérieure aux valeurs critiques lues dans une table 


élaborée par les auteurs. 


On rejette l'hypothèse de stationna- 


Il est à noter que les logiciels RATS et Eviews permettent directement l'uti- 
lisation de ces tests. 


Exercice n° 1 


LL: fichier C9EX1 


Exemple d’application des tests de racine unitaire au CAC40 


On demande d’appliquer les tests de non-stationnarité à l’indice CAC40 (indice 
représentatif de l’évolution des cours de bourse) sur une période de 1160 jours. 


Solution 


Nous allons étudier le CAC40 sur 1 160 observations quotidiennes. Le graphique 1 
illustre l’évolution de l’indice CAC40. 


Les fonction d’autocorrélation simple et partielle, pour h = 15 retards, sont obtenues 
directement par une fonction : 


Sample: 1 1160 
included abserations: 1160 


éutocosrelaton Partial Corvelation ac PAL Q-Stat Prob 


0.665 0SE65 11365 OO0D 
O.976 -0.049 23457 0.000 
OSË4 0020 33290 OCO0 
1 0663 0015 43878 OG00 
! 0.1 -0055 ©4202 OCOD 
[ 0828 00% 64275 OC00 
! 9.817 0008 4112 0000 
0 OS07 00% B3734 0000 
1 0.666 -C0t6 93144 0000 
1 10 OBES -D0$8 10253. 0000 
1 
1 
1 
1 
1 


ECO 1 Do BE Li HD 


11 O6r4 -0018 11128. © 000 
12 OB62 DO0é 12002. 0.000 
. 15 0650 -C040 12492, 0000 
j 14 ÔBâB O0ÛS 15679 0000 
| 145 OB27 0000 14444, 0090 
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Graphique 1 — Évolution de l'indice boursier CAC40 


Eviews fournit les résultats des fonctions d’autocorrélation simple (colonne AC) et par- 
tielle (colonne PAC), avec les corrélogrammes respectifs. Les bornes de l’intervalle de 
confiance sont stylisées par des traits pointillés horizontaux ; chaque terme qui sort de cet 
intervalle est donc significativement différent de 0 au seuil de 5 %. Nous nous apercevons 
que tous les termes du corrélogramme simple sont extérieurs à l'intervalle de confiance. Le 
processus n'est pas un bruit blanc (il semble même caractéristique d'un processus non sta- 
tionnaire). La statistique Q de Ljung-Box (la seule calculée par Eviews) confirme ce fait : 
Q-Stat = 14483 (au retard k= 15) > X605.15 = 25, on refuse l'hypothèse de nullité des coef- 
ficients p4 (la probabilité critique de ce test est indiquée &. = 0,000 < 0,05, donc on refu- 
se HO). Le processus CAC40 n'est pas un bruit blanc. A partir des tests de Dickey-Fuller 
nous allons examiner si le processus est non stationnaire. 


Le test de Dickey-Fuller simple consiste à estimer! les trois modèles : 

[1] : CAC, — CAC,_; = DCAC, = (1 — 1) CAC; ; 

[2] : CAC, — CAC,-_;, = DCAC, = (1 — 1) CAC, +c 

[3] : CAC, — CAC,_; = DCAC, = (1 — 1) CAC; + c + bt 

L’estimation par les MCO des paramètres du modèle [3] donne : 

DCAC; = —0,008447 CAC;-: + 14,94 + 0,002103# 

(2,053) (2,0) (1,11) 

n=1159 — (-) = rt empirique. 

Le coefficient de la droite de tendance n’est pas significativement différent de 0 
(*=1,11), on rejette l'hypothèse d’un processus TS et Lg = —2,053 > fabulé 
= —3,41 (ou n(d; — 1) = 1159 x —0,008447 = —9,79 > —21,8) ; on accepte l’hypo- 
thèse HO (valeurs critiques au seuil de 5 %) ; le processus n’est pas stationnaire. 

L’estimation par les MCO des paramètres du modèle [2] donne : 

DCAC, = —0,00709 CAC;-_: + 13,63 

(1,805) (1,85) 
n=1159 — (-) = empirique. 


1. Ces tests très brièvement présentés ici doivent faire l’objet d’une stratégie afin de tester les cas 
des hypothèses jointes. Cf. Bourbonnaïis R. et Terraza M., 2010. 
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Le terme constant n’est pas significativement différent de O (f* = 1,85), on rejette 
l'hypothèse d’un processus DS avec dérive et LG = —1,805 > futé — —2,86 ; on 
accepte l’hypothèse HO ; le processus n’est pas stationnaire. 

Enfin l’estimation par les MCO des paramètres du modèle [1] donne : 

DCAC; = 0,000174 CAC:-: 


(0,536) 
n=1159 — (-) =r empirique. 
1 = 0,536 > fubué — —1,95, on accepte l’hypothèse HO ; le processus n’est pas 


stationnaire. 
Le test DFA (avec quatre retards) conduit à des résultats similaires : 


Hypothèse HO : CAC possède une racine unitaire 

Nombre de retards (minimum du critère de Akaïke) = 4 

Test de Dickey-Fuller Augmenté t Statistique Probabilité critique 
Modèle [4] 0,46 0,81 
Modèle [5] —2,03 0,27 
Modèle [6] —2,28 0,44 


Les probabilités critiques sont toutes supérieures à 0,05, nous ne rejetons pas l’hy- 
pothèse HO ; nous pouvons donc conclure que le processus CAC40 possède une racine 
unitaire et n’est donc pas stationnaire. 

Nous procédons ensuite au test de Phillips-Perron avec une troncature / — 6. 


Hypothèse HO : CAC possède une racine unitaire 


Troncature / = 6 


Test de Phillips-Perron t Statistique ajusté Probabilité critique 
Modèle [1] 0,50 0,82 
Modèle [2] —1,94 0,31 
Modèle [3] —2,20 0,49 


Les probabilités critiques sont toutes supérieures à 0,05, nous ne rejetons pas l’hy- 
pothèse HO ; le processus CAC40 possède une racine unitaire. 
Enfin, nous procédons aux tests KPSS. 


Hypothèse HO : CAC ne possède pas une racine unitaire 
Troncature ! = 6 


Test de Kwiatkowski-Phillips-Schmidt-Shin ZM Statistique Valeur critique à 5% 
Modèle [2] 2,58 0,46 
Modèle [3] 1,31 0,14 


La statistique LM est supérieure à la valeur critique (pour un seuil de 5%) pour les 
deux spécifications, nous rejetons l’hypothèse HO, le processus CAC40 possède donc une 
racine unitaire. 

Tous les résultats sont convergents, nous pouvons donc conclure que le processus 
CAC40 n’est pas stationnaire. 

S'agit-il d’un processus de marche au hasard sans dérive ? Nous allons le vérifier en 
calculant le corrélogramme de la série filtrée par les différences premières ceci afin de 
stationnariser le processus : 

DCAC, = CAC, - CAC, ;. 
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Correlogram of GCAC 


Sample: 1 1150 
lIncluded observations: 1159 


Autocarrelation Partial Carrelation AC PAC Q-Stat Prob 


| | 


062 C062 44625 (C35 
-D019 -CG14 46772 0101 
-0.059 -CG38 6,35597 0.095 
O058 CO 10409 0034 
0.015 -C024 10665 OCSE 
-0.020 -G.018 11.145 OCf4 
0017-5010 11483 0118 
-0.006 -0.012 14572 0.11 | 

IL O4 COd6 15813 0129 | 
ill 10 0021 0016 14547 0.158 


1 
fl : 
! 
1 
! 
Ü 


D © = M On À GI M 
7 É 


il 11 Doi8 0018 14712 0,196 
| F 12 0040 0.043 16558 0.167 
L 13 -0.006 -0.018 16634 0.217 | 
é 14 0.061 -0.049 19.652 © 141 || 
: il 15-0.009 0001 19741 0.182 | 


La statistique Q a une probabilité critique de 0,182 (pour k = 15) largement supé- 
rieure à 0,05 ; nous acceptons l’hypothèse HO de nullité des coefficients du corrélogram- 
me. Le corrélogramme de la série CAC49 filtrée par les différences premières est carac- 
téristique d’un bruit blanc. La série CAC40 est donc bien un processus DS sans dérive. 

S'agit-il d’un bruit blanc gaussien ? 

L’histogramme de la distribution et les valeurs empiriques des Skewness, Kurtosis 
et de la statistique de Jarque-Bera sont donnés par : 


300 
Series: BDCAC 
Sample 2 1460 

2 Observations 1158 

200 + Mean 041720 
kecian 0. HOO0D 
Maximum 1027000 

Lis Minimum  -132.7700 
Std. Dev. 20.648585 

aoû Shawness -G.38 7407 
Kurtosis 6.496446 

SP Jérque-Bera 741.293 
Probabilit, O.00000û 

Û TT TT UT 


Les tests sont effectués à partir des valeurs : 
1/2 
__ 18i*—0] _ |—0,39—0] 


V1 = 
e | 6 
n 1159 


= 5,42 > 1,96 
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_lB—31 16.833] 


Vo = = 
* JA [24 
n 1159 
Nous rejetons l'hypothèse de normalité en ce qui concerne la symétrie et l’aplatissement 
de la distribution, ce qui est confirmé par la statistique de Jarque-Bera : 


JB =741,3 > ae (2) = 5,99 . Le processus CAC40 en différences est donc un bruit 
blanc non gaussien. 


et = 26,61 > 1,96. 


es modèles ARIMA 


Nous allons présenter une famille de processus aléatoires qui sont censés recou- 
vrir une gamme très large d’évolution possible de séries chronologiques : les 
processus autorégressifs et les processus de moyenne mobile. 


ypologie des modèles AR, MA et ARMA 
1) Modèle AR (Auto Régressif) 


a) Formulation 
Dans le processus autorégressif d’ordre p, l'observation présente y, est générée 
par une moyenne pondérée des observations passées jusqu’à la p-ième période 
sous la forme suivante : 

AR(1) : Yr = y; + €, 

AR) : Y — CRE Lo Oÿi-2 + & 


AR(p) ‘ Y: —= O1 1 + Yi) + .. + 0,Y-p + €: [4] 
Où 6:,6,...,0, Sont des paramètres à estimer positifs ou négatifs, &, est un aléa 
gaussien. 

Nous pouvons ajouter à ce processus une constante qui ne modifie en rien les 
propriétés stochastiques. L’équation [4] peut aussi s’écrire à l’aide de l’opéra- 
teur décalage D : 

(1—8, D —0,D?—...—08,D')y =&8, 


b) Caractéristiques des corrélogrammes 


Il est démontré que le corrélogramme simple d’un processus AR(p) est caracté- 
risé par une décroissance géométrique de ses termes de type : 
Pe = p* 
Le corrélogramme partiel a ses seuls p premiers termes différents de 0. 
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2) Modèle MA (Moving Average : Moyenne Mobile) 
a) Formulation 


Dans le processus de moyenne mobile d’ordre g, chaque observation y, est géné- 
rée par une moyenne pondérée d’aléas jusqu’à la g-ième période. 

MA(1L): y =Ee —oe6, ; 

MA (2) 1 Ye — Es — AiEr-1 — Es) 


MA(g): Y = €; — ŒiEs_1 — UE 2 — ... — OyEr-y [5] 
OÙ 1,4,...,0, Sont des paramètres pouvant être positifs ou négatifs et &, est un 
aléa gaussien. 
L’équation [5] peut aussi s’écrire : 
(—aD — D? —...—a,D1)e, = y. 
Dans ce processus, tout comme dans le modèle auto-régressif AR, les aléas 
sont supposés être engendrés par un processus de type bruit blanc. Nous pou- 
vons interpréter le modèle MA comme étant représentatif d’une série chronolo- 


gique fluctuant autour de sa moyenne de manière aléatoire, d’où le terme de 
moyenne mobile car celle-ci, en lissant la série, gomme le bruit créé par l’aléa. 


Il est à noter qu’il y a équivalence entre un processus MA(1) et un processus 
AR d'ordre p infini : 


MA(1) = AR(co). 
b) Caractéristiques des corrélogrammes 


Le corrélogramme simple d’un processus MA(g) est de la forme générale : 
i=q—k 
Hidi+k 


D = == ———— pour k = 0,1,...,q et © = 0 pour k > q. 


C'est-à-dire que seuls les g premiers termes du corrélogramme simple sont 
significativement différents de 0. 


Le corrélogramme partiel est caractérisé par une décroissance géométrique 
des retards. 


3) Modèle ARMA (mélange de processus AR et MA) 


a) Formulation 


Les modèles ARMA sont donc représentatifs d’un processus généré par une 
combinaison des valeurs passées et des erreurs passées. Ils sont définis par 
l’équation : 
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ARMA(p,q) : (1—68,D —8,D° —...—06,D?)y, = 
= (1—a@D—aD°?—...—a,Df}e, 
Nous avons : 


ARMA(1,0) = AR(1); ARMA(0, 1) = MA(1). 


Dans le cas d’un processus ARMA(p, g) avec constante : 


Ye = U + 01% 1 + 0x2 + + OpXr-p + €; — @iE;_; 
USE ei (07172 
> 2 on | HA 
L’espérance du processus est donnée’ par E(x;) — 
(—6@ —0, —.…—0,) 


Donc connaissant l’espérance du processus (Eviews calcule directement l’es- 
pérance du processus), la constante du processus ARMA est déterminée par : 


u = Ex) x (1— 6 —6, —.…—0,) 


b) Caractéristiques des corrélogrammes 


Les corrélogrammes simples et partiels sont, par voie de conséquence, un 
mélange des deux corrélogrammes des processus AR et MA purs. Il s’avère 


ainsi plus délicat d’identifier ces processus à partir de l’étude des fonctions 
d’autocorrélation empiriques. 


Le tableau 2 synthétise les caractéristiques, en termes de corrélogrammes, 
des processus AR, MA et ARMA. 


Tableau 2 — Résumé des propriétés des fonctions d’autocorrélation 
simple et partielle 


Processus Fonction autocorrélation simple | Fonction autocorrélation partielle 
AR(1) Décroissance exponentielle(@, > 0) ou | Pic significatif pour le premier retard: 
sinusoïdale amortie (9, < 0) Positif si 0,>0et négatif si 8, <0, 
les autres coefficients nuls pour des 
retards > 1 
AR(2) Décroissance exponentielle ou sinusoï- | Pics significatifs pour le premier et 
dale selon les signes de ©, et ©, second retards, les autres coefficients sont 
nuls pour des retards > 2 
AR(p) Décroissance exponentielle et/ou sinu- | Pics significatifs pour les p premiers 
soïdale retards, les autres coefficients sont nuls 
pour des retards > p 
1. Il suffit de remplacer chaque terme E(x;) = E(xs-1) = E(xr-2) =... = E(x-») car la série 


est stationnaire. 
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Processus Fonction autocorrélation simple | Fonction autocorrélation partielle 
MA(1) Pic significatif pour le premier retard : | Décroissance exponentielle (@, > 0) ou 
positif si æ , < O et négatif si @, > 0. sinusoïdale amortie (@ , < 0) 
Les autres coefficients sont nuls pour 
des retards > 1 
MA(2) Pics significatifs pour le premier et Décroissance exponentielle ou sinusoïda- 
second retards. Les autres coefficients | le selon les signes de «, etæ, 
sont nuls pour des retards > 2 
MA(q) Pics significatifs pour les g premiers Décroissance exponentielle et/ou sinusoï- 
retards. Les autres coefficients nuls pour| dale 
des retards > q 
ARMA(1, 1) Décroissance géométrique à partir du | Décroissance exponentielle (œ, > 0) ou 
premier retard, le signe est déterminé | sinusoïdale amortie (œ ,<0) 
par 0, -@, 
ARMA(p, q) Décroissance exponentielle ou sinusoï- | Décroissance exponentielle ou sinusoïda- 
dale amortie tronquée après (q — p) le amortie tronquée après p — q retards 
retards 


4) Conditions d'utilisation 


Les modèles AR, MA, ARMA ne sont représentatifs que de chroniques : 
— stationnaires en tendance ; 
— corrigées des variations saisonnières. 


extension aux processus ARIMA et SARIMA 


Les tests de Dickey-Fuller et Dickey-Fuller Augmenté envisagés précédemment 
permettent de déterminer si la série est stationnaire et dans le cas d’une non- 
stationnarité de quel type il s’agit : TS et DS. 


S1 la série étudiée est de type TS, il convient de la stationnariser par régres- 
sion sur le temps et le résidu d’estimation est alors étudié selon la méthodologie 
de Box-Jenkins. Ceci permet de déterminer les ordres p et q des parties AR et 
MA du résidu. Le modèle est toujours dans ce cas un ARMA(p, q). 


S1 la série étudiée est de type DS, il convient de la stationnariser par passa- 
ge aux différences selon l’ordre d’intégration 7 = d (c’est-à-dire le nombre de 
fois qu’il faut différencier la série pour la rendre stationnaire). La série diffé- 
renciée est alors étudiée selon la méthodologie de Box-Jenkins qui permet de 
déterminer les ordres p et q des parties AR et MA. On note ce type de modèle 
ARIMA(p, d, q). 

Les modèles SARIMA permettent d’intégrer un ordre de différenciation lié 
à une saisonnalité généralisée par la transformation : (1 — D‘)y, = y, — y,, où 
s correspond à la périodicité des données (s = 4 pour une série trimestrielle, 
s — 12 pour une série mensuelle). 
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Exercice n° 2 


Génération de processus ARMA et analyse des corrélogrammes 
On demande de générer sur 200 observations, de manière artificielle, les processus 
suivants et d’en étudier les corrélogrammes. 
1))MA(L):» =2+(1+0,8 De, 
2) AR(1): (1—0,9D)y, =2+e, 
3) MA(2) : y =2+(1+0,6 D — 0,3 D?e, 
4) AR(2) : (1—0,9 D +0,7 D?)y =2+& 
5) ARMA(1, 1): (1—0,9D)y, =2+(1+0,8 D}s, 
avec €, —> N(0; 1). 
Solution 


Le programme Eviews (,4 C9EX2.PRG) permettant de générer les processus est dis- 
ponible en téléchargement. 


a méthode de Box et Jenkins 


La partie autorégressive d’un processus, notée AR, est constituée par une com- 
binaison linéaire finie des valeurs passées du processus. La partie moyenne 
mobile, notée MA, est constituée d’une combinaison linéaire finie en f des 
valeurs passées d’un bruit blanc. Wold (1954) montre que les modèles ARMA 
permettent de représenter la plupart des processus stationnaires. L'approche de 
Box et Jenkins (1976) consiste en une méthodologie d’étude systématique des 
séries chronologiques à partir de leurs caractéristiques afin de déterminer, dans 
la famille des modèles ARIMA, le plus adapté à représenter le phénomène étu- 
dié. Trois étapes principales sont définies. 


echerche de la représentation adéquate : 
l'identification! 


La phase d'identification est la plus importante et la plus difficile : elle consiste 
à déterminer le modèle adéquat dans la famille des modèles ARIMA. Elle est 


1. Attention : il ne faut pas confondre l’emploi de ce terme avec son utilisation dans le cadre des 
modèles à équations simultanées. 
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fondée sur l’étude des corrélogrammes simple et partiel. Nous pouvons essayer 
d’édicter quelques règles simples facilitant la recherche des paramètres p, d, q 
du modèle ARIMA. 


1) Désaisonnalisation 


Dans le cas d’une série affectée d’un mouvement saisonnier, il convient de la reti- 
rer préalablement à tout traitement statistique. Cette saisonnalité est ajoutée à la 
série prévue à la fin du traitement afin d’obtenir une prévision en terme brut. 


2) Recherche de la stationnarité en terme de tendance 


Si l’étude du corrélogramme simple et les tests statistiques s’y rapportant (statis- 
tique Q) présagent d’une série affectée d’une tendance, il convient d’en étudier les 
caractéristiques selon les tests de Dickey-Fuller. La méthode d’élimination de la 
tendance est fonction du processus DS ou TS sous-jacent à la chronique étudiée. 


Après stationnarisation, nous pouvons identifier les valeurs des paramètres 
P, g du modèle ARMA. 


+ Si le corrélogramme simple n’a que ses g premiers termes (g = 3 maximum) 
différents de 0 et que les termes du corrélogramme partiel diminuent lente- 
ment, nous pouvons pronostiquer un MA(g). 


+ Si le corrélogramme partiel n’a que ses p premiers termes (p = 3 maximum) 
différents de 0 et que les termes du corrélogramme simple diminuent lente- 
ment, cela caractérise un AR(p). 


* Si les fonctions d’autocorrélation simple et partiel ne paraissent pas tronquées, 
il s’agit alors d’un processus de type ARMA, dont les paramètres dépendent 
de la forme particulière des corrélogrammes. 


stimation des paramètres 


Les méthodes d’estimation diffèrent selon le type de processus diagnostiqué. 
Dans le cas d’un modèle AR(p), nous pouvons appliquer une méthode des 
moindres carrés (cf. chapitre 7) ou bien nous pouvons utiliser les relations exis- 
tantes entre les autocorrélations et les coefficients du modèle (équations de Yule- 
Walker). 


L’estimation des paramètres d’un modèle MA(g) s’avère plus complexe. 
Box et Jenkins suggèrent d'utiliser une procédure itérative de type balayage que 
nous pouvons illustrer de la manière suivante. 


Supposons le processus : 
(—6,D —06,D°)y, = (1 — a D — æ,D°}e, 


que nous pouvons écrire : 


Éléments d'analyse des séries temporelles e 261 


1 

7 1-0 D—6,D? 
1 

a — — 6 

1 — 8, D — 0, D? 


Y (— a D — a D?}e, 


Nous posons v, = 


LE] 


il vient alors : 
v, — Ov, — Ov, — 6, [6] 
Ce qui nous donne : 
Ve = V — HV — AoVs_2 OÙ UV, = ÿ; + ŒiU,_1 + Qu, [7] 
Nous pouvons alors initialiser la procédure de balayage en partant de deux 
intervalles de valeurs plausibles pour (&,; &) et d’un pas d’incrémentation. 
Puis, pour chaque couple de valeurs (&@,; &), nous posons : à) = 0 et à, — 0, 
et nous calculons les valeurs estimées de ©, à partir de la relation [7] : 
D — }2 
D = Ya + D 
Da = Ya + Gi03 + Oil, etc. 


Après calcul de toutes les valeurs de ©, nous estimons les paramètres @, et 
8, par la méthode des moindres carrés appliquée à l’équation [6] : 


Ur — CT Vs + Ov) Er [8] 


Nous retenons les valeurs 4, 8, et &, @ qui rendent minimum la somme 
des carrés des résidus issue de la régression de l’équation [8]. 


Cette méthode d’estimation n’est valide que si le nombre de paramètres à 
estimer n’est pas trop important. 


Nous pouvons mentionner des méthodes d’estimation fondées sur une maxi- 
misation de fonctions de vraisemblance recourant alors à des procédures itéra- 
tives de régression non linéaire, telles que celles envisagées au chapitre 6. 


ests d'adéquation du modèle et prévision 


Les paramètres du modèle étant estimés (on vérifie la convergence de la procé- 
dure itérative d’estimation), nous examinons les résultats d'estimation. 


- Les coefficients du modèle doivent être significativement différents de 0 (le test 
du t de Student s’applique de manière classique). Si un coefficient n’est pas 
significativement différent de 0, il convient d’envisager une nouvelle spécifi- 
cation éliminant l’ordre du modèle AR ou MA non valide. 


* L'analyse des résidus : si les résidus obéissent à un bruit blanc, il ne doit pas 
exister d’autocorrélation dans la série et les résidus doivent être homoscédas- 
tiques. Les tests suivants peuvent être utilisés. 
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— le test de Durbin Watson, bien qu’il ne permette de détecter que des auto- 
corrélations d’ordre 1 ; 

— les tests de Box et Pierce et de Ljung et Box (cf. I, € de ce chapitre) qui 
permettent de tester l’ensemble des termes de la fonction d’autocorréla- 
tion. Si le résidu est à mémoire, cela signifie que la spécification du modè- 
le est incomplète et qu’il convient d’ajouter au moins un ordre au proces- 
SUS ; 

— le test ARCH d’hétéroscédasticité (cf. chapitre 5, II, D) effectué à partir de 
la fonction d’autocorrélation du résidu au carré. 


La phase de validation du modèle est très importante et nécessite le plus sou- 
vent un retour à la phase d’identification. 


Lorsque le modèle est validé, la prévision peut alors être calculée à un hori- 
zon de quelques périodes, limitées car la variance de l’erreur de prévision croît 
très vite avec l’horizon. 


Nous pouvons résumer les différentes étapes de la méthodologie de Box et 
Jenkins à partir du schéma 2. 
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Schéma 2 — Les étapes de la méthodologie de Box et Jenkins 
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Exercice n° 3 
+, fichier C9EX3 


Analyse par la méthodologie de Box et Jenkins et prévision 
de trois processus aléatoires 


Soit les trois processus x1, x2 et x; connus sur 220 périodes, on demande de : 

— analyser leurs propriétés stochastiques ; 

— déterminer, le cas échéant, l’ordre du processus ARMA(p, q) : 

— effectuer une prévision, par une méthode adaptée, à un horizon de 3 périodes. 


Solution 
Les résultats sont fournis sans les calculs intermédiaires. 


1) Analyse du processus x: 


Le graphique 2 présente l’évolution du processus x, et son corrélogramme, à leur 
lecture le processus est non stationnaire. 
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Graphique 2 — Évolution et fonction d’autocorrélation simple du processus x 1 


a) Stratégie simplifiée de test : tests de Phillips-Perron (fenêtre de Newey-West = 4) 
Estimation du modèle [3] 


Null Hypothesis: X1 has a unit root 
Exogenous: Constant, Linear Trend 
Bandwidth: 4 (Fixed using Bartlett kernel) 
Adj. t-Stat Prob. 
Phillips-Perron test statistic — 2.148148 0.5157 
Dependent Variable: D(X1) 
Included observations: 219 after adjustments 
Variable Coefficient Std. Error t-Statistic Prob. 
X1(-1) — 0.039046 0.021398 — 1.824772 0.0694 
C 3.725580 0.811468 4.591160 0.0000 
@TREND(1) 0.124280 0.066711 1.862974 0.0638 
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Nous acceptons l’hypothèse HO de racine unitaire, nous ne pouvons donc pas inter- 
préter les probabilités critiques calculées directement selon les lois de Student. Nous 
devons nous référer à la table statistique 7 en fin d'ouvrage : t* = 1,86 < 1} — 2,79 
(valeur lue à 5%, modèle [3]), acceptation de l’hypothèse b = 0. Selon la stratégie 
séquentielle de test nous estimons le modèle [2]. 


Estimation du modèle [2] 


Null Hypothesis: X1 has a unit root 
Exogenous: Constant 
Bandwidth: 4 (Fixed using Bartlett kernel) 


Adj. t-Stat Prob. 
Phillips-Perron test statistic 0.307267 0.9783 
Dependent Variable: D(X1) 
Included observations: 219 after adjustments 
Variable Coefficient Std. Error t-Statistic Prob. 
X1(-1) 0.000673 0.001830 0.367843 0.7133 
C 3.128542 0.749736 4.172860 0.0000 


Nous acceptons l’hypothèse HO de racine unitaire, nous ne pouvons pas interpréter 
les probabilités critiques calculées directement selon les lois de Student 
= 4,17 > 198 — 2,84 (valeur lue à 5%, modèle [2]), nous refusons l’hypothèse 
c = 0. Il s’agit donc d’un processus DS avec dérive : Xi, = x1,-1 + € + &,. Nous le sta- 
tionarisons par le passage aux différences premières. 


b) Analyse des fonctions d’autocorrélation simple et partielle sur la série stationnaire 


Sample. 1 22 
included obsersations: 219 

Awocorreletion  Partial Correlation AC PAC Q-Stat Prob 
1 0.665 055% 66446 000 

2 0.107 -0.715 76.209 0.00 

3 0.481 0.278 12609 0.000 

4 0266 0155 14404 000 

5 0.119 0.212 14722 0000 

6 0.276 -0.193 16481 000 

7 0.125 0037 166.36 0.00 

8 -0.064 -0040 17038 0000 

939-0132 0103 17439 0000 

10 0015 00% 17444 000 

11 0.144 0093 173.28 0.00 

12 0.134 003 168350 0.000 

13 0,010 -0172 18553 000 

14 0.136 0153 167.92 000 

15 0.133 -0.23 142.11 00 

16 0.050 0.12 19271 0.00 

17 -0.008 -0391 15272 0.00 

18 0028 0212 19292 OO 

19 0.047 0276 15.45 O0 

2 0.02 0.492 155.59 0.000 


Il ne s’agit pas d’une marche au hasard (les probabilités critiques de la Q-Stat sont 
toutes très largement inférieures à 0,05), le processus est à mémoire, il existe donc une 
représentation dans la classe des processus ARMA. 
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c) Recherche des ordres p et q de la représentation ARMA 


Compte tenu de la forme des corrélogrammes simple et partiel nous sélectionnons 
un modèle ARMA(2, 1). Nous constatons que la constante est significativement diffé- 
rente de O, et des essais d’autres représentations concurrentes (ARMA(1, 1)) indiquent 
des valeurs des critères d’information (AIC ou SC) supérieures au modèle retenu. 


Dependent Variable: D(X1) 
Included observations: 217 after adjustments 
Variable Coefficient | Std. Error | t-Statistic Prob. 
C 3.327748 0.346054 9.616272 0.0000 
AR(1) 0.760134 0.066149 11.49128 0.0000 
AR(2) - 0.604867 | 0.062249 | -9.716905 0.0000 
MA(1) 0.500890 0.073470 6.817644 0.0000 


d) Validation de la représentation 
- Tests de Student sur les coefficients : 


Les coefficients sont tous significativement différents de O (probabilités critiques 
inférieures à 0,05) 


+ Analyse des résidus 


Corrélogramme du résidu Corrélogramme du résidu au carré 
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Le corrélogramme du résidu indique qu’il s’agit d’un processus sans mémoire, le 
corrélogramme du résidu au carré (test ARCH, cf. chapitre 5) n’indique aucun terme de 
significativement différent de 0 ; l’homoscédasticité des résidus est donc vérifiée. Les 
résidus sont donc un processus de bruit blanc. 


Les résidus sont-ils gaussiens ? La statistique de Jarque-Bera (JB = 2,06) indique 
une probabilité critique de 0,35, nous acceptons l’hypothèse HO de normalité des rési- 
dus. 


La représentation est validée, 1, Est un processus ARIMA(2, 1, 1) avec constante. 


e) Prévision 


La valeur de la constante est égale à : p = E(x1,) X (1 — @; — 6) 
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La prévision est donnée par : 
AXi = 0 X Axis 1 + 6 X Axys_2 + Ex) X (1 — 0 — 60) +6, +aie, : 
AXy = 0,76 x Axi,_1 — 0,60 x Ax1,_2 + 3,33 x (1 —0,76+ 0,60) +, +0,50 x 8,1 
Xi = Xi + Axis 
AXion = 0,76 X AX1220 — 0,60 X Ax1,219 + 2,81 + 8221 + 0,50 X €220 
Axa = 0,76 x 7,76 — 0,60 x 12,39 + 2,81 + 0 + 0,50 x 0,87 = 1,65 
Jusqu’à l’observation f = 220 nous prenons &, = résidu, pour f > 220, E(e,) = 0. 
X1,221 = X1,220 + AX122 = 741,90 + 1,65 = 743,55 
Ax1,22 = 0,76 X AXx1,221 — 0,60 X Ax1,220 + 2,81 + 8222 + 0,50 X 8x 
AX1,22 = 0,76 X 1,65 — 0,60 x 7,76 + 2,81 + 0 + 0 = —0,63 
X1,22 = X1,221 + AX1,22 = 743,55 — 0,63 — 742,92 


AX1,223 = 0,76 X AX1,222 Cm 0,60 X AX: 221 + 2,81 + €223 + 0,50 X €222 
AX1,223 = 0,76 x —0,63 — 0,60 x 1,65 + 2,81 +0 +0 = 1,34 
X1,223 — X1,222 + AX1 223 —= 742,92 + 1,34 —= 744,26 


Les résultats sont présentés au tableau 3. 


Tableau 3 - Calcul des prévisions du processus ARIMA(2, 1, 1) 


t X, AXy €, = résidus 
218 721,75 10,2 4,07 
219 734,14 12,39 2,28 
220 741,90 7,76 0,87 
221 743,55 1,65 0 
222 742,92 — 0,63 0 
223 744,26 1,34 0 


2) Analyse du processus x2 


Le graphique 3 présente l’évolution du processus x et son corrélogramme, à leur 
lecture le processus semble non stationnaire. 
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Graphique 3 - Évolution et fonction d’autocorrélation simple du processus X 
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a) Stratégie simplifiée de test : tests de Dickey-Fuller 


Doit-on utiliser le test de Dickey-Fuller simple ou le test de Dickey-Fuller 
Augmenté ? 


Préalablement nous déterminons la valeur de p, si p = 0 nous utilisons le test de 
Dickey-Fuller. À partir du modèle [2] (modèle avec constante) nous sélectionnons 
l’ordre p du modèle à partir des critères d’information d’Akaïke et de Schwarz. Les deux 
critères sont convergents! p = 3. 


Null Hypothesis: X2 has a unit root 
Exogenous: Constant 
Lag Length: 3 (Automatic based on AIC, MAXLAG=8) 


Null Hypothesis: X2 has a unit root 
Exogenous: Constant 
Lag Length: 3 (Automatic based on SIC, MAXLAG=8) 


Nous appliquons donc la stratégie séquentielle des tests à partir des tests de Dickey- 
Fuller Augmenté avec p = 3. 


Estimation du modèle [3] 


Null Hypothesis: X2 has a unit root 
Exogenous: Constant, Linear Trend 
Lag Length: 3 (Fixed) 
t-Statistic Prob.* 
Augmented Dickey-Fuller test statistic — 2.253814 0.4570 
Test critical values: 1% level — 4.001108 
5% level — 3.430766 
10% level — 3.138998 
Augmented Dickey-Fuller Test Equation 
Dependent Variable: D(X2) 
Sample (adjusted): 5 220 
Included observations: 216 after adjustments 
Variable Coefficient Std. Error t-Statistic Prob. 
X2(- 1) — 0.080344 0.035648 — 2.253814 0.0252 
D(X2(- 1)) — 0.229159 0.070487 — 3.251071 0.0013 
D(X2(- 2)) — 0.209633 0.069319 — 3.024181 0.0028 
D(X2(- 3)) — 0.168372 0.067849 — 2.481571 0.0139 
C 1.314041 0.575187 2.284546 0.0233 
@TREND(1) 0.002458 0.003842 0.639940 0.5229 


Nous acceptons l’hypothèse HO de racine unitaire, nous ne pouvons pas interpréter 
les probabilités critiques calculées directement selon les lois de Student. Nous devons 


1. En cas de divergence des critères nous retenons la valeur de p minimum des deux critères. 
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donc nous référer à la table statistique 7 en fin d'ouvrage : 1j = 0,64 < 1 8 3,12 
(valeur lue à 5 %, modèle [3]), acceptation de l’hypothèse b = 0. Nous estimons le 


modèle [2]. 


Estimation du modèle [2] 


Null Hypothesis: X2 has a unit root 


Exogenous: Constant 


Lag Length: 3 (Fixed) 


t-Statistic Prob.* 
Augmented Dickey-Fuller test statistic — 2.306282 0.1709 
Test critical values: 1% level — 3.460596 
5% level — 2.874741 
10% level — 2.573883 
Augmented Dickey-Fuller Test Equation 
Dependent Variable: D(X2) 
Sample (adjusted): 5 220 
Included observations: 216 after adjustments 
Variable Coefficient Std. Error t-Statistic Prob. 
X2(- 1) — 0.067264 0.029165 — 2.306282 0.0221 
D(X2(- 1)) — 0.239180 0.068630 — 3.485076 0.0006 
D(X2(- 2)) — 0.217876 0.068017 — 3.203270 0.0016 
D(X2(- 3)) — 0.174967 0.066968 — 2.612710 0.0096 
C 1.347763 0.571966 2.356368 0.0194 


Nous acceptons l’hypothèse HO de racine unitaire, nous ne pouvons pas interpréter 
les probabilités critiques calculées directement selon les lois de Student : 
1 = 2,35 < 198 = 3,39 (valeur lue à 5 %, modèle [2]), nous acceptons l’hypothèse 
c = 0. Il s’agit donc d’un processus DS sans dérive : xx = x2-1 + &,. Nous le stationa- 


risons par le passage aux différences premières. 


b) Analyse des fonctions d’autocorrélation simple et partielle sur la série stationnaire 


Sample 1722 
Included obsersations 218 
Falocorrelstion Parteal Carélalion AC PAC CSist Prob 
Œ : 1-0.1# 0195 8 9.004 
Q 2-0151 0197 5 0001 
(| 3-0.101 C 183 D 0.001 
ill 4 OU46 006: 3 103 
Cp 5 0.016 C043 4 0006 
1] 6 0084 CC67 1 0 O6 
1(: 7 -0.072 0095 203 0008 
19 8 002% C037 19 2.013 
11 9 00 O4 25 O6 
1] 10 0.042 CO10 4 0.023 
(| 110.141 C6 5 O8 
1{ 12 0.066 CC 4 0009 
1Ë 13 -0.043 C095 gs 0D13 
17 14 013% OC 65 O005 
1l 15 -0.06 0013 5 0006 
1} 16 UU74 033 5 O0 
1 17-0071 ©0091 3379 0010 
1] 18 0.061 CO17 283 0.D12 
il 19 002 0016 3428 Q017 
1 20 0.011 C042 34.414 0023 
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Il ne s’agit pas d’une marche au hasard (les probabilités critiques de la Q-Stat sont 
toutes très largement inférieures à 0,05), le processus est à mémoire, il existe donc une 
représentation dans la classe des processus ARMA. 


c) Recherche des ordres p et q de la représentation ARMA 


Compte tenu de la forme des corrélogrammes simple et partiel nous sélectionnons 
un modèle ARMA(1, 1). Nous constatons que la constante n’est pas significativement 
différente de 0, et des essais d’autres représentations concurrentes (ARMA(2, 0) ou 
ARMA(0, 2)) indiquent des valeurs des critères d’information (AIC ou SC) supérieures 
au modèle retenu. 


Dependent Variable: D(X2) 
Sample (adjusted): 3 220 
Included observations: 218 after adjustments 


Variable Coefficient | Std. Error t-Statistic Prob. 
AR(1) 0.437628 0.127029 3.445091 0.0007 
MA(1) — 0.743275 | 0.094329 |- 7.879625 0.0000 


d) Validation de la représentation 
- Tests de Student sur les coefficients 


Les coefficients sont tous significativement différents de O (probabilités critiques 
inférieures à 0,05). 


+ Analyse des résidus 


Corrélogramme du résidu Corrélogramme du résidu au carré 
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Le corrélogramme du résidu indique qu’il s’agit d’un processus sans mémoire, le 
corrélogramme du résidu au carré n’indique aucun terme de significativement différent 
de O ; les résidus sont donc homoscédastiques. Les résidus sont donc un bruit blanc. 


Les résidus sont-ils gaussiens ? La statistique de Jarque-Bera (JB = 5,88) indique 
une probabilité critique de 0,052, nous acceptons (de justesse !) l’hypothèse de norma- 
lité des résidus. 


La représentation est validée, X), est un processus ARIMA(1, 1, 1) sans constante. 
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e) Prévision 


La prévision est donnée (E(&,) = 0 pour t > 220) par : 


Axa = O1 X AXs_1 + d185-1 
AX —= 0,437 X AX-1 E 0,7436,-_: 


X2 = X2-1 + AX 


Axion = 0,437 X AX2 220 — 0,743 X 80 
Ax2on = 0,437 x —1,318 — 0,743 x —0,889 = 0,084 
X2o21 = X2,220 + AX2on1 = 19,61 + 0,084 = 19,69 


AX2 20 —= 0,437 X AX2 221 nn 0,743 X €22] 
AX2,222 —= 0,437 X 0,084 ou 0,743 x 0 — 0,037 
X2,222 — X2,221 + AX2,222 = 19,69 + 0,037 = 19,73 


AX2 293 —= 0,437 X AX2,222 LE 0,743 X E€222 
AX2 23 = 0,437 X 0,037 = 0,743 x 0 = 0,016 
X2,223 = X2,292 + Ax%2,23 = 19,73 + 0,016 = 19,75 


Les résultats sont présentés au tableau 4. 


Tableau 4 — Calcul des prévisions du processus ARIMA(I1, 1, 1) 


t X AXxxy €, = résidus 
218 20,438 3,328 2,464 
219 20,930 0,492 0,867 
220 19,611 — 1,318 — 0,889 
221 19,695 0,084 0 
222 19,732 0,037 0 
223 19,748 0,016 0 


3) Analyse du processus x3 


Le graphique 4 présente l’évolution du processus x3 et son corrélogramme, à leur 


lecture le processus est clairement non stationnaire. 
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Graphique 4 - Évolution et fonction d’autocorrélation simple du processus X3 
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a) Stratégie simplifiée de test : tests de Phillips-Perron (choix automatique de la fenêtre 
de Newey-West) 


Estimation du modèle [3] 


Null Hypothesis: X3 has a unit root 
Exogenous: Constant, Linear Trend 
Bandwidth: 1 (Newey-West using Bartlett kernel) 
Adi. t-Stat Prob.* 
Phillips-Perron test statistic — 15.03107 0.0000 
Test critical values: 1% level — 4.000511 
5% level — 3.430477 
10% level — 3.138828 
Phillips-Perron Test Equation 
Dependent Variable: D(X3) 
Sample (adjusted): 2 220 
Included observations: 219 after adjustments 
Variable Coefficient Std. Error t-Statistic Prob. 
X3(- 1) — 1.023098 0.068065 — 15.03108 0.0000 
C 10.33495 0.639662 16.15689 0.0000 
@TREND(1) 3.065841 0.203980 15.03013 0.0000 


Nous refusons l’hypothèse HO de racine unitaire, nous pouvons donc interpréter 
directement les probabilités critiques calculées selon les lois de Student, refus aussi de 
l’hypothèse b = 0. 

Le processus x; est un TS (Trend Stationnary), X3 = 40 + ait +£, avec 
t= 1, 2,...,n. La bonne méthode de stationnarisation consiste donc à effectuer une 
régression sur le temps. 


b) Modélisation 


Soit la régression de x; sur une tendance déterministe r = 1,2, ,n 


Dependent Variable: X3 
Method: Least Squares 
Included observations: 220 


Variable Coefficient | Std. Error t-Statistic | Prob. 
C 7.171985 0.409466 17.51547 0.0000 
TENDANCE 2.996632 0.003213 932.7294 0.0000 


c) Validation de la représentation 
- Tests de Student sur les coefficients 


Les coefficients sont tous significativement différents de O (probabilités critiques 
inférieures à 0,05). 
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+ Analyse des résidus 


Corrélogramme du résidu 


Sample: 1 220 
Includsd obzersbons: 220 


Autocorrelation Parti Corcistion AC PAC QStx 


Corrélogramme du résidu au carré 


Sample. 1 220 


included cbservations: 220 


Prob Au relation 


0.1187 
2134 
04052 
0.7625 
06957 
2.9518 
3.0085 
35457 
36265 
3.9059 
1 4.7971 
5.6712 
22093 
125 
12.972 
14.330 
16.087 
15.185 
1 16251 
16.337 


0.730 
0.935 
0.939 
0.943 
0.971 
0.611 
0.684 
0.896 
0.922 
0.962 
0.341 
0.932 
0.767 
0.529 
0.604 
0.574 
0.518 
0.531 
0.640 
0.695 


Partial Cocrelation 


AC FAC 


0 006 -0 066 
© 006 -0.001 
005 0.046 
006: 0053 
L 
0 
© 


021 0.006 
269 0.062 


10 -0.067 -0.06 
11-0022 -0.041 
12 -© 005 -0 043 
13 -0.037 -0.061 
14 0020 0007 
15 0010 -002 
16 0123 0.106 
17 0024 0024 
18 0 101 -0 12 
19 -0.030 -0.074 
20 0050 0.073 


074-0050 4 33 


0109-0124 $ 
Q011 0022 5 


*rob 


0 197 
0.433 
0.545 
0.563 
0.494 
0.603 
2.503 
0 316 
0.428 
0.428 


1 0606 


0.551 
2.643 
0 702 
0766 
0.565 
0.624 
0 520 
0.572 
2.596 


Le corrélogramme du résidu indique qu’il s’agit d’une marche au hasard, le corré- 
logramme du résidu au carré n’indique aucun terme de significativement différent de 0 ; 
les résidus sont donc homoscédastiques. Les résidus sont donc un bruit blanc. 


Les résidus sont-ils gaussiens ? La statistique de Jarque-Bera (JB = 1,249) indique 
une probabilité critique de 0,54, nous acceptons l’hypothèse de normalité des résidus. 


La représentation est validée x3, est un processus TS. 


d) Prévision 


La prévision est donnée par : 


Xy = do +at+e, avec (E(e,) =0)Vt 


X3 = 7,17 + 2,996 x t 


X3,221 = 7, 17 2 2,996 x 221 — 669,428 
X3,222 = 7,17 + 2,996 x 222 — 672,424 
X3,223 = 7,17 + 2,996 x 223 — 675,421 
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a modélisation VAR 


a modélisation économétrique classique à plusieurs équations 

structurelles (cf. chapitre 8) a connu beaucoup de critiques 

(Granger [1969] et Sims [1980]) et de défaillances face à un envi- 
ronnement économique très perturbé. Les prévisions élaborées à l'aide 
de ces modèles se sont révélées très médiocres. Les critiques principales 
formulées à l'encontre de ces modèles structurels concerne la simultanéi- 
té des relations et la notion de variable exogène. La représentation! VAR 
(Vector AutoRegressive) - généralisation des modèles autorégressifs (AR) 
au cas multivarié (cf. chapitre 9) - apporte une réponse statistique à l'en- 
semble de ces critiques. Dans cette représentation, les variables sélec- 
tionnées? en fonction du problème étudié ont toutes, a priori, le même 
statut et on s'intéresse alors à des relations purement statistiques. 


Nous présentons tout d'abord en section |. la spécification générale 
d'un modèle VAR, puis nous abordons les méthodes d'estimation et de 
prévision en section Il. La dynamique d'un modèle VAR et l'analyse des 
chocs sont traitées dans la section III. ; enfin, la section IV est consacrée à 
la recherche du sens de la causalité entre les variables. 


1. Le terme de représentation convient mieux que le terme de modélisation, car l’économiste ne 
spécifie pas des relations économiques en tant que telles. 
2. En général celles d’un modèle théorique. 
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eprésentation d'un modèle VAR 


xemple introductif 


Soit une représentation VAR dans laquelle on considère deux variables y, et y. 


Chacune de ces variables est fonction de ses propres valeurs passées et de 
celles de l’autre. 


Par exemple le modèle VAR d’un ordre p = 4, s’écrit : 


4 4 
Vu = & + ) DiYui + ) CiVai — diYa + Eu 
i=1 i=1 


4 4 
Ya = A + DD T D Can — dyn + Ex 


i=] i=] 


Les variables y,, et y, sont considérées comme étant stationnaires (cf. cha- 
pitre 9), les perturbations &,, et &, (les innovations ou les chocs) sont des bruits 
blancs de variances constantes o7 et o; et non autocorrélées. Nous pouvons 
immédiatement constater l’abondance de paramètres à estimer (ici 20 coeffi- 
cients) et les problèmes de perte de degrés de liberté qui en résultent. À la lec- 
ture de ce modèle, il apparaît qu’il n’est pas sous forme réduite : en effet, y,, a 
un effet immédiat sur y, et réciproquement y, a un effet immédiat sur y,. Ce 
système initial est appelé forme structurelle de la représentation VAR. Sous 
forme matricielle, ce modèle devient : 


; 
BY, = A+) Aie, [Hi] 


i=1 
avec : 


_ 1 d | _|[d . bi Ci __ | Er 
ce | = [>| = [7] =[? || 


Pour obtenir un modèle VAR sous forme standard, on multiplie de part de 
d’autre dans [1] par B'. Le modèle sous forme standard s’écrit : 


4 4 
0 dL 2 
Yu = à + ) di Yu + ) A Yari + Vi 
= i=1 
4 4 
_ 0 > , 1 E 2 
Ya — ad; + do; Yiri Eu d;; Yar-i + Vo 
i=1 i=1 
Dans cette spécification, les erreurs v,, et v, sont fonction des innovations 


81, et & ; en effet, puisque v = B-'e, on obtient : 


Vi = (En — diex)/( — did;) et v, = (8x — de,,)/( — did;) 


276 e ÉCONOMÉTRIE 


On démontre que : 
Eu) = 0; Em) = 0; E(vyv;) = 0; E(vyu-;) = 0 
Les erreurs ont une espérance nulle et sont non autocorrélées. 
E(v?) = (02 + d?02)/(1 — did}; E(v?) = (oi + d?02)/(1 — did) 
La variance de l’erreur est constante (indépendante du temps). 
E(vivs) = —(do2 +di02)/( — did) 


Si d, = d; = 0, les variables y,, et y, n’ont pas d’influence synchrone l’une 
sur l’autre, les erreurs v,, et v, sont non corrélées. Dans le cas contraire, les 
erreurs v., et v,, sont corrélées et donc une variation de l’une de ces erreurs à un 
instant donné a un impact sur l’autre. 


a représentation générale 


La généralisation de la représentation VAR à k variables et p décalages (notée 
VAR(p)) s’écrit sous forme matricielle : 


Y, = À + AY, + A}, LE “ss Ates + v, 


1 2 k 0 
Vis ai di Ne ai af Vi 
0 
V2, di  d; di; a; V2 
avec Y, = | . Na [0° . [iu=l. 
1 2 k 0 
Yes di dx di dy Var 


On note : 3°, = E(wv!), la matrice de dimension (k, k) des variances cova- 
riances des erreurs. Cette matrice est bien sûr inconnue. 


Cette représentation peut s’écrire à l’aide de l’opérateur retard : 
{—A,D—A,D? —...—A,D°)Y, = À, + v, ou encore A(D)}, = À, + v, 
Condition de stationnarité 


Un modèle VAR est stationnaire, s’il satisfait les trois conditions classiques : 
— E() = n Vf; 

— Var(Y,) < co ; 

— Cov(P, 4) = ELU — H)%u4 — n)1 = Te Ve. 


On démontre! qu’un processus VAR(p) est stationnaire si le polynôme dé- 
fini à partir du déterminant : det(I — A,z — A,z° —...— A,z’) = 0 a ses racines 
à l’extérieur du cercle unité du plan complexe. 


1. Cf. Hamilton J. D., page 259, 1994. 
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Exercice n° 1 


Recherche des conditions de stationnarité d’un modèle VAR 
Soit le processus : 
BU los ob la 
Ya 1 0,3 0,411 > 1 ex 
On demande d’étudier les conditions de stationnarité. 


Solution 


Le déterminant est égal à : 


1 0 0,2 0,7 Zi = 1,30 
det —| ? . = 1—0,6z— 0,137? : 
ü (L | e 0 2 |?) É oi É 5,91 
Les deux racines sont en valeur absolue supérieures à 1, le processus est donc sta- 
tionnaire. 


a représentation ARMAX 


La représentation précédente peut être généralisée!, par analogie avec les pro- 
cessus ARMA(p, q), à un modèle dont les erreurs sont autocorrélées d’ordre gq. 


Y, — As Æ Ai; LU AY; ess App ni Vs LE Biv,-; T B:v,_ Ré B;vi-4 


Il s’agit d’un processus ARMA multivarié noté : ARMAX ou parfois 
VARMA. 


Les conditions de stationnarité sont analogues à celles d’un processus 
ARMA univarié : un processus VAR est toujours inversible, il est stationnaire 
lorsque les racines de son polynôme sont à l’extérieur du cercle unité du plan 
complexe. 


— Un processus VMA est toujours stationnaire. Il est inversible si les racines 
de son polynôme retard sont à l’extérieur du cercle unité du plan complexe. 


— Les conditions de stationnarité et d’inversibilité d’un ARMAX sont don- 
nées par la partie VAR et la partie VMA de l’ARMAX. 


1. II s’agit d’une application au cas multivarié du théorème de décomposition de Wold (1954). 
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stimation des paramètres 


Les paramètres du processus VAR ne peuvent être estimés que sur des séries 
chronologiques stationnaires. Aïnsi, après étude des caractéristiques des séries, 
soit les séries sont stationnarisées par différence, préalablement à l’estimation 
des paramètres dans le cas d’une tendance stochastique, soit il est possible 
d’ajouter une composante tendance à la spécification VAR, dans le cas d’une 
tendance déterministe. 


éthode d'estimation 


Dans le cas d’un processus VAR, chacune des équations peut être estimée par 
les MCO, indépendamment les unes des autres (ou par une méthode de maxi- 
mum de vraisemblance). 


Soit le modèle VAR(p) estimé : 


ÿ, SA LA Vs HAPSSLMRA Ve Er 


e étant le vecteur de dimension (k,1) des résidus d’estimation e;,, e,,..., eu. 


Et on note : ÿ’, la matrice des variances covariances estimées des résidus du 
modèle. 


Les coefficients du processus VAR ne peuvent être estimés qu’à partir de 
séries stationnaires. Ainsi, après étude des caractéristiques des chroniques, soit 
les séries sont stationnarisées par différence, préalablement à l’estimation des 
paramètres dans le cas d’une tendance stochastique, soit il est possible d’ajouter 
une composante tendance à la spécification VAR, dans le cas d’une tendance 
déterministe. 


De même, nous pouvons ajouter à la spécification VAR des variables binaires 
afin de corriger un mouvement saisonnier ou une période anormale. 


étermination du nombre de retards 


Pour déterminer le nombre de retards d’un modèle à retards échelonnés (cf. cha- 
pitre 7), nous avons présenté les critères de Akaïke et de Schwarz. Dans le cas 
de la représentation VAR, ces critères peuvent être utilisés pour déterminer 
l’ordre p du modèle. La procédure de sélection de l’ordre de la représentation 
consiste à estimer tous les modèles VAR pour un ordre allant de 0 à h (h étant 
le retard maximum admissible par la théorie économique ou par les données 
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disponibles). Les fonctions AIC(p) et SC(p) sont calculées de la manière 
suivante : 


2 
AIC(p) = Ln [det| 5, |] + ce 
2 
SC(p) = Ln [detl5, ] + pe 


avec : k = nombre de variables du système ; nr = nombre d’observations ; 
p = nombre de retards ; ÿ', = matrice des variances covariances des résidus du 
modèle. 


Le retard p qui minimise les critères AIC ou SC est retenu. 
révision 


Les coefficients du modèle étant estimés, la prévision peut être calculée en n à 
l’horizon d’une période, par exemple pour un VAR(1), de la manière suivante : 
Ÿ, (D = À + A7, 

À l'horizon de 2 périodes, la prévision est : 
Ÿ, 2) = A5 + Ai, (D) = Ào + A1 A0 + A7, 
À l'horizon de 3 périodes, la prévision s’écrit : 
?,G) = Âo+ A1Ÿ, 0) = (A + À + AP) A0 + AY, 
etc. 


Lorsque h tend vers l’infini, nous constatons que la prévision tend vers une 
valeur constante (état stationnaire) puisque A! —> 0 si i — oo. 


L’espérance de la matrice de l’erreur de prévision est nulle, sa variance est 
donnée par : 
D,D)=M),M+M > M +...+Mi ni), M, , où M; est calculé par la 
formule de récurrence suivante : 
min(p.i) 
M= Ÿ ÂMi, i=1,2...et M=I 
Ainsi, il vient : ” 
M; = À; M: = AM; + À,M = À + À, : 
M; = AM + AM + A3Mo = À; + À; 2 + AA, + À; 
etc. 


La variance de l’erreur de prévision pour chacune des prévisions des k 
variables (G?(h)) se lit sur la première diagonale de la matrice ÿ°,(h). 
L’intervalle de prévision au seuil de (1—aæ/2) est donné par: 
Y,(h) +12 x G,(h) avec 1/2? valeur de la loi normale. 
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Exercice n° 2 
LŸ: fichier C10EX2 


Spécification, estimation et prévision d’un modèle VAR 


Nous cherchons à modéliser, sous la forme VAR, la demande (y1,) et les prix (y) 
d’une matière première. Nous disposons des données trimestrielles CVS et en différences 
premières sur 18 ans (tableau 1). 


Tableau 1 —- Demande et prix CVS et en différences premières (extrait des données) 


Date Yir Ya 
0001Q1 —146,4 —75,6 
0001Q2 19,2 1,8 
0013Q3 19,2 —16,2 
0013Q4 50,4 3,6 


On demande : 
1) de rechercher l’ordre du modèle VAR, 
2) d’estimer les paramètres du modèle, 


3) de calculer une prévision pour l’année 19 avec son intervalle de confiance à 95 %. 


Solution 
1) Rechercher l’ordre du modèle VAR 


Nous allons utiliser les critères de Akaiïke et de Schwarz pour des décalages h allant 
de 0 à 4. Nous devons donc estimer quatre modèles différents et retenir celui dont les cri- 
tères AIC et SC sont les plus faibles. 


Estimation du modèle pour h = 1 
Ju | aÿ a, af Virt Vis 
= olt| 2 + 
Ya a; dy dj Var-1 Var 
Yi = a? Su ah Yu-1 EU a Va + Vis 


0 1 2 
Va = 5 + dur + 45 Yau-1 + Vy 


Pour estimer les paramètres de ce modèle, nous pouvons utiliser les MCO équation 
par équation. 


Ou encore : 


yir = 0,00676 x 1-1 — 0,6125 x yx_1 + 17,129 
ya = —0,1752 x y1_1 + 0,2992 x 2-1 — 12,862 


Les deux résidus d’estimation sont alors calculés : e;, et e, ainsi la matrice des 
variances covariances des résidus est donnée par : 


| Due Dax | 
1 1 
De je | 
1 1 
1 | 106500, 16 | . | 1500,002 oo. 


7114787812  85205,25 —674,339  1200,074 


Le 


SI. 
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Attention, certains logiciels (par exemple Eviews à partir de la version 4) estiment 
cette matrice des variances covariances en divisant la somme des carrés ou du produit par 
le degré de liberté de chaque équation estimée soit : 


S,= 1 106500,16 —47878,12 | | 1566,18  —704,09 
€ 71—2-—1|-47878,12 85205,25 | |—704,09 1253,02 
Dans toute la suite des calculs nous retenons la méthode 1, soit : 
Var(e;;) = 1 500,002 ; Var(e;) — 1 200,074 ; Cov(e:,,e2;) — —674,339 
1 500,002  —674,339 


it det = = 1345370. 
Soit det(33.) | — 674,339 an Fe 

Pour p= 1: 

2k° p : 
AIC(p) = Ln [det (5,)] + = Ln(1 345 379) + (2 x 22 x 1)/71 = 14,28 
n 
et 
kpL 
SC(p) = Ln [det(5:,)] + 00 = Ln(1 345 379) + (2? x 1 x Ln(71))/71 
= 14,47 
Nous pouvons calculer de la même manière : 
AIC(2) = 14,31 ; AIC(3) = 14,39 ; AIC(4) = 14,45 
SC(2) = 14,56 ; SC(3) = 14,78 ; SC(4) = 14,97 

Le nombre de décalages retenu correspond à la valeur la plus faible des critères 

soit : p = 1. 


2) Estimation des paramètres 
Le modèle VAR(1) estimé s’écrit : 


y = 0,00676 x y_1 — 0,6125 x 2-1 + 17,1292 + er, 
(0,06) (4,47) (2,87) 


R? = 0,28 ; n = 71 ; (+) =t de Student 


Ya = —0,1752 X Yir—1 + 0,2992 X Ya] — 12,862 + e 
(1,84) (2,44) (2,41) 


R? =0,21 ;:n =71; () = t de Student 


3) Prévision 
La prévision est calculée en faisant « tourner » le modèle : 
Pro = 0,0067 x y184 — 0,6125 X y184 + 17,129 
Piou = —0,1752 x y184 + 0,2992 x y184 — 12,862 


Fix = 0,0067 x 50,4 — 0,6125 x 3,6 + 17,129 = 15,3 
Fox = —0,1752 x 50,4 + 0,2992 x 3,6 — 12,862 — —20,6 


Yio2 = 0,0067 x 15,3 — 0,6125 x —20,6 + 17,129 — 29,9 
Yio2 = —0,1752 x 15,3 + 0,2992 x —20,6 — 12,862 = —21,7 
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Yo: = 0,0067 x 29,9 — 0,6125 x —21,7 + 17,129 — 30,6 
Pi9:3 = —0,1752 x 29,9 + 0,2992 x —21,7 — 12,862 = —24,6 


Fioa = 0,0067 x 30,6 — 0,6125 x —24,6 + 17,129 — 32,4 
Fioa = —0,1752 x 30,6 + 0,2992 x —24,6 — 12,862 = —25,6 


La variance de l’erreur de prévision est donnée par la formule : 


D, R)=N, +M Mi +... + Mi D, Mi, où Mi est calculé par la formule 
min(p.i) 
de récurrence suivante : M; — + A;jMi-; i=1,2,... et Mo = 1. Les variances se 
j=1 
lisent sur la première diagonale de la matrice ÿ°,(h). 


Aünsi, il vient : M; — À, ; M = À M = Fr : M3 = À M L À ; etc., car le 
modèle est un VAR(1) et donc seul À 1 est estimé. 


1500,02 —674,34 


—674,34  1200,1 
l’erreur de prévision pour Yo: est égale à 1 500,02 et la variance de l’erreur de prévi- 


Soit à l’horizon h = 1, nous avons ÿ°,(1) = | | . La variance de 


sion pour Ÿi»1 est égale à 1 200,1. L’intervalle de confiance pour yis1 est donné 
par : 15,3 + 1,96 x 38,73 — [—60,64 ; 91,17] et pour 191 est donné par : 


—20,6 + 1,96 x 34,64 = [—88,52 ; 47,27]. 


Soit à l’horizon h = 2, nous avons : 


Z,0)=>,+A17,, À, soit : 
1500,02 —674,34 
2.Q = ee 1200,1 | ï 


| 0,00676  —0,1753 


0,00676  —0,6126 || 1500,02 —674,34 
—0,1753  0,2992 —674,34  1200,1 


| 1955,99 ne 


—0,6126  0,2992 —969,88 1424,37 


Pour = 3: 3.,(3) = 3. +A1 3. À + 473. 47 
Y G)= 1500,02 —674,34 0,00676  —0,6126 1500,02 —674,34 
< 7 | 674,34  1200,1 —0,1753  0,2992 —674,34  1200,1 
0,00676  —0,1753 se 0,00676  —0,6126 : 1500,02 —674,34 
—0,6126  0,2992 —0,1753  0,2992 —674,34  1200,1 


0,00676  —0,1753 es 2042,63 —1043,88 
—0,6126  0,2992 | | —1043,88  1489,48 


Pour h=4:3,(4)=X,+A 2, À, + A?3, A? + A5 AŸ 


2. = se 1200,1 —0,1753  0,2992 —674,34  1200,1 


Be un Eee —0,6126 Be un 


1 500,02 à | 0,00676 ni | 1 500,02 en 
2 
—0,6126  0,2992 —0,1753  0,2992 | —674,34  1200,1 
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0,00676  —0,1753 1° | 0,00676 —0,6126 1° | 1500,02 —674,34 
—0,6126  0,2992 —0,1753  0,2992 _674,34  1200,1 


| 0,00676 il : | 2067,67 —1 a 

—0,6126  0,2992 _1064,00 1 505,73 
IC 102 = 29,9 + 1,96 x 44,22 = [—56,82 ; 116,54] 
Icy192 = —21,7 + 1,96 x 37,74 = [—95,68 ; 52,26] 
IC 103 = 30,6 + 1,96 x 45,19 = [—57,95 ; 119,21] 
Ic,193 = —24,6 + 1,96 x 38,59 = [—100,23 ; 51,05] 
IC,194 = 32,4 + 1,96 x 45,47 = [—56,72: 121,52] 
Ic,1o4 = —25,6 + 1,96 x 38,80 = [—101,64; 50,46] 


ynamique d'un modèle VAR 


Les modèles VAR permettent d’analyser les effets de la politique économique, 
cela au travers de simulations de chocs aléatoires! et de la décomposition de la 
variance de l’erreur. Cependant, cette analyse s’effectue en postulant la constan- 
ce de l’environnement économique « toutes choses étant égales par ailleurs ». 


eprésentation VMA d'un processus VAR 


Nous avons vu qu’un modèle AR(1) a une représentation MA(co). Par analogie, 
nous pouvons démontrer qu’un VAR(1) a une représentation VMA(c). Le 
modèle sous cette forme va permettre de mesurer l’impact sur les valeurs pré- 
sentes d’une variation des innovations (ou des chocs) v,, et de v,,. 


Soit la représentation VAR(p) stationnaire : 
ÿ, = A + Aiÿ;-; + AY, DE rm PE on AY + y, 
Sa représentation VMA(co) est donnée par : 


Y=u+v+ Mit Mvit..=u+ÿ Mu 
i—0 


avec : = (I— À; — A —...— A,)7! x As 


min(p,i) 
et M; = > A;Mi;-; i=1,2,... et M =1 


j=1 


1. Le terme d’innovation est aussi souvent employé. 
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Sous cette forme, la matrice M apparaît comme un « multiplicateur d’im- 
pact », c’est-à-dire que c’est au travers de cette matrice qu’un choc se répercute 
tout le long du processus. Une variation à un instant donné f de », affecte toutes 
les valeurs suivantes de Y,, l’effet d’un choc (ou d’une innovation) est donc per- 
manent et va en s’amortissant. 


nalyse et orthogonalisation des « chocs » 


L'analyse d’un choc consiste à mesurer l’impact de la variation d’une innovation 
sur les variables. Prenons l’exemple du modèle estimé de l’exercice 2 : 


Yy = 0,00676 x y,,_1 — 0,6125 x y:,_, + 17,129 +e,, 
Ya = —0,1752 %x y1,_1 + 0,2992 x y,,_, — 12,863 + e:, 
Une variation à un instant donné de e,, a une conséquence immédiate sur y; 


puis SUT au et Ya, par exemple s’il se produit en f un choc sur e;, égal à 1, 
nous avons l’impact suivant : 


| Ayrl TI 
sfr] (4 


= .F'Ayuu 1 [0,00676 -0,6126][ 11 | 0,0067 
D EN a ES 0,2992 | Lo . Er 


—0,1753  0,2992 —0,175 —0,054 


À la période 42 ra nee 0 eo à -| nl 
21+2 


etc. 


Les différentes valeurs ainsi calculées constituent la « fonction de réponse 
impulsionnelle ». Dans ce schéma, nous faisons l’hypothèse que les résidus e;, et 
e, Sont indépendants entre eux. Or, cette hypothèse est rarement vérifiée ; en 
effet, nous avons montré en section L., qu’il peut exister une corrélation entre les 


erreurs v,, et de v,, cette corrélation pouvant être mesurée à l’aide des résidus 
d’estimation : pee, = Ce 
Ce X Ce 

Cependant si ce coefficient nous renseigne bien sur la liaison contemporaine 
entre les deux résidus, il n’indique pas le sens de la causalité. C’est pourquoi, 
nous devons faire une hypothèse supplémentaire concernant la relation entre les 
erreurs : par exemple, dans l’exercice 2, la réflexion économique laisse présager 
qu’une variation du prix (y) a un impact sur la demande (»,,). Un choc sur y, 
n’a donc pas d’impact contemporain sur y, ; en revanche un choc sur y, a un 
impact contemporain (mesuré par le coefficient de corrélation entre les résidus) 


sur y. Dans cet exemple, le coefficient de corrélation est égal à 
Cov(e;,e | & 
ie Core) = —0,503 ; en faisant l'hypothèse que o, # © 


,» un choc 
Ce X Oe 


aléatoire de 1 sur y se traduit par une baisse de -0,503 sur y,. Le tableau 2 
illustre cette dissymétrie des innovations sur les variables. 
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Tableau 2 — Analyse des chocs sur les variables y1 et y» 


avec Vi, = —0,503 x w, 

Î Yi Ya Î Yir Ya 

1 1,000 0,000 1 —0,530 1,000 
2 0,007 —0,175 2 —0,616 0,387 
3 0,107 —0,054 3 —0,241 0,224 
4 0,034 —0,035 4 —0,139 0,109 
5 0,022 —0,016 5 —0,068 0,057 
6 0,010 —0,009 6 —0,035 0,029 
7 0,005 —0,004 7 —0,018 0,015 
8 0,003 —0,002 8 —0,009 0,008 
9 0,001 —0,001 9 —0,005 0,004 
10 0,001 —0,001 10 —0,002 0,002 
11 0,000 0,000 11 —0,001 0,001 
12 0,000 0,000 12 —0,001 0,001 


Le choix du sens de l’impact est donc très important et conditionne les 
valeurs obtenues. Nous pouvons observer que l’effet d’une innovation s’estom- 
pe au cours du temps. Cela caractérise un processus VAR stationnaire. 


Le graphique 1 présente les deux fonctions de réponses impulsionnelles. 


Le problème de la corrélation contemporaine des erreurs et donc de l’impact 
d’un choc sur une variable est traité, d’une manière générale, par la recherche 
d’une représentation à erreurs orthogonales. Reprenons l’exemple d’un modèle 
VAR à deux variables : 


Vis = it + biYast + Vis 
Var = Dis + DaYast + Vos 


avec Var(vi;) = 6, Var(w;) = 0$, et Cov(i,,0,) = k + 0. 


En calculant y, — (k oi )y1,, on obtient : 
Y21 = k/oÿ Vis + (@ — & X Ko) Yi + (b2 — bi x K/o5) 1 +: — k/os Vi 


On pose : », = W,; — k/o, Lis 
Cov(v:,,0,) — E(visv) = Cov(v 12) — Kk/of E(V 1) =k—-k=0. 
Les erreurs (ou innovations) ne sont plus corrélées. L'analyse des chocs 


peut donc s’effectuer sur les deux équations suivantes dont les erreurs sont 
orthogonales : 


Vire = ir + DiVosr + Vis 
Var = kK/oË Vis + (a — à X kK/o7 ) y + (2 — bi x k/o 


2 
VI v] Var LR Vi — k/o,, Vis 
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Nous remarquons que, sous cette forme, nous avons fait apparaître dans la 
deuxième équation la causalité instantanée entre y;, et y, telle qu’elle existait 
dans le VAR structurel (cf. I. A.). Cependant, la causalité instantanée entre y, et 
Y2. n'apparaît pas dans la première équation. Dans cette procédure d’orthogona- 
lisation, les résidus sont indépendants, nous pouvons faire apparaître soit une 
causalité instantanée entre y, et y1, soit une causalité instantanée entre y, et 
Y2, mais pas les deux à la fois : il s’agit de l’ordre de décomposition. 


La généralisation à un modèle VAR à & variables nécessite le recours à des 
procédures d’orthogonalisation! de matrice et s’avère donc complexe. Il 
convient de noter que les résultats sont influencés par le choix de l’équation ser- 
vant de base à la transformation. Les résultats sont différents si la transformation 
affecte y,, à la place de y, c’est pourquoi le choix? de l’ordre des variables 
modifie les résultats obtenus. 


LME 


(LE 


LT 


M 
BUTS a  EELELELLELELELcLc . = = = 
—h  : a “ a * mi 1 Es 
{ut 
"= "1 
[ELU 
LOL 
El 
RL 
Gaue 
DS 
con + a 
——— 
È è dt : 5 3 5 uw 1 L 
D 
Ce) TT 


pass 


Graphique 1 — Fonctions de réponses impulsionnelles 


1. Cf. Hamilton J. D. page 318, 1994. 
2. Les logiciels d’économétrie offrent la possibilité de choisir l’ordre des variables et permettent 
ainsi de simuler les différents cas de figure. 
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écomposition de la variance 


La décomposition de la variance de l’erreur de prévision a pour objectif de cal- 
culer pour chacune des innovations sa contribution à la variance de l’erreur. Par 
un technique mathématique!, on peut écrire la variance de l’erreur de prévision 
à un horizon h en fonction de la variance de l’erreur attribuée à chacune des 
variables ; il suffit ensuite de rapporter chacune de ces variances à la variance 
totale pour obtenir son poids relatif en pourcentage. 


Reprenons notre modèle VAR(1) à deux variables y;, et y, la variance de 
l’erreur de prévision pour y,,., peut s’écrire : 
0% (h) = 07 [mi (0) + mi, (D +... + mi(h —1)] 
+de [m2 (0) + m2,(1) +... + m3, (h —1)] 


où les m;;, sont les termes de la matrice M de la section IIT.A. 


À l'horizon h, la décomposition de la variance, en pourcentage, des propres 
innovations de y;, sur y1,, est donnée par : 


O2 [mi,(0) + m?,(D +... +mi(h — 1] 
O2 (h) 


Et la décomposition de la variance, en pourcentage, des innovations de y,, sur 
02 [m3:(0) + m2) +...+m2(h—1)] 


, est donnée par : 
d È 2) 


L'interprétation des résultats est importante : 


— si un choc sur &,, n’affecte pas la variance de l’erreur de y, quel que soit 
l'horizon de prévision, alors y:, peut être considéré comme exogène car y 
évolue indépendamment de &,, ; 


— a contrario, Si un choc sur &,, affecte fortement — voire totalement — la 
variance de l’erreur de y, alors y: est considéré comme endogène. 


Dans la pratique, les résultats ne sont pas aussi marqués mais indiquent la 
contribution de chacune des variables à la variance de l’erreur. 


hoix de l'ordre de décomposition 


Il est à noter que le problème de la corrélation contemporaine des erreurs, et 
donc de l’impact d’un choc sur une variable, implique un choix de décomposi- 


1. La matrice ÿ° étant toujours définie positive, la décomposition de Cholesky permet de diago- 
naliser la matrice des variances covariances de l’erreur de prévision, et ainsi d’identifier les 
variances propres à chacune des variables. Nous ne pouvons pas aborder dans le cadre de ce 
manuel cette technique, le lecteur peut se référer à Hamilton J. D. (1994) pour tous les complé- 
ments mathématiques. 
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tion qui fournit des résultats dissymétriques en fonction de l’ordre des variables. 
Le problème est plus complexe si le nombre de variables est important. 
Prenons l’exemple d’un VAR à 4 variables Y1, Y2, Y3 et Y4. 


Si nous choisissons l’ordre de décomposition de Cholesky suivant : Y3 Y2 
Y1 Y4, cela entraîne : 


— un choc en période 1 sur Y3 (la variable la plus exogène) a un impact sur 
l’ensemble des quatre variables ; 


— un choc en période 1 sur Y2 à un impact sur Y2, Y3 et Y4, absence de cor- 
rélation contemporaine avec Y3 ; 


— un choc en période 1 sur Y1 a un impact sur Y1 et Y4, absence de corréla- 
tion contemporaine avec Y3 et Y2 ; 


— et, enfin, un choc en période 1 sur Y4 (la moins exogène) n’a un impact que 
sur elle-même, absence de corrélation contemporaine avec Y3, Y2 et Y1. 


Le tableau 3 illustre cet exemple de décomposition et d’analyse des chocs. 
Nous ne présentons que les deux premières périodes. 


Tableau 3 — Exemple de décomposition Y3, Y2, Y1, Y4 


Cholesky Ordering : Y3 Y2 Y1 Y4 


Response of Y1 : 
Period Y1 Y2 Y3 Y4 
1 1.603662 1.022459 1.402923 0.000000 
2 — 0.395786 — 0.151091 0.488095 — 0.275476 
Response of Y2 : 
Period Y1 Y2 Y3 Y4 
1 0.000000 5.434671 4.125310 0.000000 
2 0.875767 — 1.251545 0.115017 — 0.105811 
Response of Y3 : 
Period Y1 Y2 Y3 Y4 
1 0.000000 0.000000 4.544690 0.000000 
2 — 0.241257 — 0.954324 — 1.584595 — 0.476602 


Response of Y4 : 


Period Y1 Y2 Y3 Y4 
1 0.768803 1.686351 2.315711 2.091513 
2 — 0.129818 — 1.104756 — 0.927459 — 0.186928 


L'ordre de décomposition s’effectue donc de la variable supposée être la plus 
exogène vers la variable la moins exogène. Dans le doute, il convient d’effec- 
tuer plusieurs combinaisons différentes d’ordre de décomposition et d’analyser 
la robustesse des résultats. 
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Exercice n° 3 
+, fichier C10EX2 


Analyse d’une fonction de réponse impulsionnelle et décomposition 
de la variance 


À partir de la représentation VAR(1) estimée à l’exercice 2, on demande de calculer 
et d'interpréter les fonctions de réponses impulsionnelles et la décomposition de la 
variance des erreurs. 


Solution 


Les résultats sont issus de Eviews 3 (RATS possède une procédure 
« IMPULSE.PRG >» permettant elle aussi de calculer tous ces éléments). 


Nous considérons qu’une innovation sur y,, n’influence pas de manière instantanée 
Y2,, en revanche une innovation sur y2, à une influence contemporaine sur y1, (un choc 
sur la variable prix influence la demande mais pas réciproquement). 


La matrice des variances covariances des résidus est égale (cf. exercice 2) à 
= 1500,002  —674,3398 

© \(-674,3398  1200,074 /° 

Calcul des chocs initiaux 


L'ordre de décomposition des variables est le suivant Y2 Y1. L'analyse des chocs doit 
donc s’effectuer sur les deux équations suivantes dont les résidus sont orthogonalisés 
(cf. II. B.) : 


Y1. dépend de vi, = (ei, — k/oSe11) 
Y21 dépend de 0; = e,; 


Var(vi,r) = Var(eis — Cov(er,,e2:)/62 23) 


_ 2Cov(e;,e2) [Cov(e::,ex)1? 
Var(vi:) = Var(es;) — Van ee) cu Mare) x Var(e;;) 
D: 2 
En ren [Cov(er;,e;)] 
ar(ex) [Var(e)] 


Var(v:,,) = Var(e:) — Cov(e:,,e2)°/Var(e;) 
L’amplitude du choc sur y,, est égale à une fois l’écart type orthogonalisé de v,, soit 


V/Var(er) — Cov(er,e2)2/Var(ex) = 4/1 500,002 — 674,33982/1 200,074 = 33,48. 
Ce choc n’a pas d’effet instantané sur y2.. 


L’amplitude du choc sur y, est égale à une fois l’écart type orthogonalisé : 
Or, Var(w:,,) = Var(e2,) = 1 200,074, le choc sur y, est donc égal à 34,62. 


Ce choc se répercute instantanément sur y:,, il est donc égal, après orthogonalisa- 
tion, à 34,62 x Cov(e:,e2)/Var(e>.,) soit 34,62 x —674,3398/1 200,074 = —19,4659. 


Une fois les chocs initiaux calculés, nous calculons les fonctions de réponse impul- 
sionnelle comme précédemment, les chocs se répercutent ensuite sur les deux processus 
en s’amortissant, signe de la stationnarité du processus VAR. 
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Fonctions de réponse impulsionnelle à un écart type orthogonalisé (Eviews 3) 


Réponse de Y1 : Réponse de Y2 : 

Période | à un choc sur Y1| à un choc sur Y2 | Période | à un choc sur Y1 | à un choc sur Y2 
1 33,48254 —19,46591 1 0,000000 34,64208 
2 0,226363 —21,35271 2 —5,868694 13,77894 
3 3,596584 —8,585080 3 —1,795947 7,866119 
4 1,124479 —4,876681 4 —1,167853 3,858783 
5 0,723007 —2,396789 5 —0,546587 2,009549 
6 0,339717 —1,247217 6 —0,290298 1,021480 
7 0,180128 —0,634172 7 —0,146419 0,524297 
8 0,090912 —0,325462 8 —0,075390 0,268057 
9 0,046797 —0,166407 9 —0,038496 0,137265 
10 0,023898 —0,085211 10 —0,019723 0,070245 


Ordre : Y2 Y1 (Y2 est la cause de Y1) 


Le graphique 2 présente ces fonctions de réponse impulsionnelles. 


Response of YŸ1 to One S.D. Innnovations 


Response of Ÿ2 to One S.D. Innnovations 


40 


--Y2 


Graphique 2 — Fonctions de réponses impulsionnelles 


Décomposition de la variance (Eviews 3) 


Décomposition de la variance de Y1: Décomposition de la variance de Y2: 

Période SE Y1 Y2 Période SE Y1 Y2 
1 38,72986| 74,73859 | 25,26141 1 34,64208 | 0,000000 | 100,0000 
2 44,22659| 57,31782 | 42,68218 2 37,74089 | 2,418013 | 97,58199 
3 45,19547| 55,51993 | 44,48007 3 38,59373 | 2,528876 |97,47112 
4 45,47172| 54,90856 | 45,09144 4 38,80374 | 2,592156 | 97,40784 
5 45,54058| 54,76783 | 45,23217 5 38,85958 | 2,604496 | 97,39550 
6 45,55892| 54,72930 | 45,27070 6 38,87409 | 2,608129 | 97,39187 
7 45,56369| 54,71940 | 45,28060 7 38,87790 | 2,609036 | 97,39096 
8 45,56494| 54,71679 | 45,28321 8 38,87889 | 2,609278 | 97,39072 
9 45,56527| 54,71611 | 45,28389 9 38,87916 | 2,609341 | 97,39066 
10 45,56536| 54,71593 | 45,28407 10 38,87922 | 2,609358 | 97,39064 

Ordre : Y2 Y1 (Y2{est la cause de Y1) 
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La décomposition de la variance indique que la variance de l’erreur de prévision de 
y1, est due à 55 % à ses propres innovations et à 45 % à celles de y,,. La variance de 
l’erreur de prévision de y, est due à 2,6 % à y... et à 97,4 % à y:,. Cette dissymétrie 
d’effet va être étudiée par l’analyse de la causalité. 


Enfin, nous remarquons que ce tableau nous indique les écarts types de l’erreur de pré- 
vision pour y1, et y2, que nous avions calculés de manière fastidieuse lors de l’exercice 2. 


a causalité 


Au niveau théorique, la mise en évidence de relations causales entre les 
variables économiques fournit des éléments de réflexion propices à une meilleu- 
re compréhension des phénomènes économiques. De manière pratique, « the 
causal knowledge » est nécessaire à une formulation correcte de la politique 
économique. En effet, connaître le sens de la causalité est aussi important que 
de mettre en évidence une liaison entre des variable économiques. 


ausalité au sens de Granger 


Granger (1969) a proposé les concepts de causalité et d’exogénéité : la variable 
ya, est la cause de y1,, si la prédictibilité! de y,, est améliorée lorsque l’informa- 
tion relative à y, est incorporée dans l’analyse. Soit le modèle VAR(p) pour 
lequel les variables y; et y, sont stationnaires : 


1 1 1 1 
Vis do da; b; Vis d; b, Vis-2 
= + + +... 
pr] 4] Ë el Ë 2 + 
+ a, b, Vit-p + Er 
a, b, Yor-p £a 


Le bloc de variables (ÿ2:_1,Y2-,...,Y2-,) St considéré comme exogène par 
rapport au bloc de variables (y1:_1,y1-2,...,y1-,) Si le fait de rajouter le bloc y, 
n’améliore pas significativement la détermination des variables y,,. Ceci consis- 
te à effectuer un test de restrictions sur les coefficients des variables y, de la 
représentation VAR (noté RVAR = Restricted VAR). La détermination du retard 
p est effectuée par les critères AIC ou SC (cf. ILB). Soit : 


° y, ne cause pas y,, Si l'hypothèse suivante est acceptée HO : 
bi=b;=...=b, =0. 


° yi, ne cause pas y, Si l'hypothèse suivante est acceptée HO : 
ad =a=...=a=0. 


Si nous somme amenés à accepter les deux hypothèses que y, cause y, et 
que y, cause y,,, on parle de boucle rétroactive « feedback effect ». 


1. Le terme de prédictibilité semble préférable au terme de causalité ; en effet, dire que y, cause 
x, Signifie seulement qu'il est préférable de prédire x; en connaissant y, que sans le connaître. 
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Ces tests peuvent être conduits à l’aide d’un test de Fisher classique (cf. cha- 
pitre 3, test de Wald) de nullité des coefficients, équation par équation ou bien 
directement par comparaison entre un modèle VAR non contraint (UVAR) et le 
modèle VAR contraint (RVAR). On calcule le ratio de vraisemblance suivant : 


L' = (n— 0) x (Ln] Xpyar | — Lnl Xuvarl) Qui suit un x? à 2 x p degrés de 
liberté avec : 


D rar = Matrice des variances covariances des résidus du modèle contraint, 
D _uvar = Matrice des variances covariances des résidus du modèle non contraint, 
n = nombre d’observations, 


c = nombre de paramètres estimés dans chaque équation du modèle non 
contraint. 


Si L*> x? lu dans la table, alors on rejette l’hypothèse de validité de la 
contrainte. 


ausalité au sens de Sims 


Sims (1980) présente une spécification de test légèrement différente, en consi- 
dérant que si les valeurs futures de y,, permettent d’expliquer les valeurs pré- 
sentes de y:,, alors y:, est la cause de y. 


Ceci se traduit par la représentation suivante : 


P P P 
0 1 2 2 
Yu = &i + > Ai Vus Eu ) Ah Va + ÿ bi Yuti + Eu 
i=1 i=1 i=1 


P P P 
0 1 2 1 
Ya = 3 + > A2 Vie Æe > Ya La ) bi Virti À Ex 
i=1 i=1 i=1 


° y1, ne cause pas y, Si l’hypothèse suivante est acceptée HO : 
b=b=...=b;=0. 


° y ne cause pas y,, Si l'hypothèse suivante est acceptée HO : 
bi=b; =... =b,=0. 


Il s’agit là encore d’un test de Fisher classique de nullité de coefficients. 


Exercice n° 4 
LL, fichier C10EX2 


Tests de causalité de Granger et de Sims 


On demande, à partir de la représentation VAR(1) estimée lors de l’exercice 2, de 
procéder aux tests de Granger et de Sims. 
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Solution 


Nous procédons au test de Fisher équation par équation. 
— Test de Granger 
+ HO: y, ne cause pas y, 


Nous estimons les modèles suivants : 


Yu = 0,006760 * y1,-1 — 0,6125 + y2,_1 + 17,129632 + ei, 
R? = 0,28 ; n = 71 ; SCRU = 106500,2 (non contraint) 
Vis = 0,2359 * Vis] + 26,9448 + Er 

R? = 0,067 ; n = 71 ; SCRR = 13792,6 (contraint) 

_ (SCRR — SCRU)/c 137924,6 — 106500,2)/1 


= = = 20,064 
SCRU/(n—-k—1) 106500,2/(71—-2—1) 


* 


c = nombre de restrictions (nombre de coefficients dont on teste la nullité). 

F > EF Le & 4, on rejette l’hypothèse HO, y, explique significativement la variable 
y, il y a donc causalité au sens de Granger de y2 vers y. 

Ou bien : 
L* = (n — cn) EE pyar | — En Eyvar D = (1 —1)(4,44 — 14,11) _ 23,29 
> x2(2) = 5,99, on rejette l'hypothèse de validité de la contrainte. 

+ HO: y;, ne cause pas y» 


Ya = —0,17527 + y1,-1 + 0,29926096 x y2,-1 — 12,862837 + ex 
R? = 0,21 ; n = 71 ; SCRU = 85205,25 (non contraint) 

Var = 0,4075 * Vas] — 15,391 + ex 

R? = 0,168 ; n = 71 ; SCRR = 89452,77 (contraint) 

_ (SCRR — SCRU)/c _ (89452,77 — 85205,25)/1 


_ = = 3,389 
SCRU/(n—k—1) 85205,22/(71—2—1) 


* 


F<F 15e & 4, on accepte l’hypothèse HO, y, n’explique pas significativement la 
variable »2, , il n’y a donc pas causalité au sens de Granger de y1, vers y». 


Ou bien : 


L* = (n — c)(Enl Epyag | — En] Eyvar D = (1 - D(4,17 — 14,11) = 4,52 
< x2(2) = 5,99, on accepte l'hypothèse de validité de la contrainte. 


Ce résultat ne doit pas nous surprendre puisque y,, est la variable représentative de la 
demande et y2, du prix. 


— Test de Sims 
+ HO: y;, ne cause pas y» 
Nous estimons les modèles suivants (sur la même période de 78:2 à 95:3) : 


Vis = —0,01435 X Vir1 — 0,579 *X Vas — 0,357 * V2s+1 + 8,713 és 
R? = 0,37 ; n = 70 ; SCRU = 92676,66 (non contraint) 


Yu = 0,007654 x y1,_1 — 0,6145 x ÿ2,_1 + 16,714 +e;, 
R? = 0,28 ; n = 70 ; SCRR = 105952,6 (contraint) 
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__ (105952,6 — 92676,66)/1 
7 92676,66/(70 — 3 — 1) 


F > EF, Fee & 4, on rejette l’hypothèse HO, y:,, explique significativement la 
variable y:1,, il y a donc causalité au sens de Sims de y, vers y. 


* 


= 9,45 


+ HO: y2, ne cause pas y, 


Ya = —0,0967 x Vu + 0,2259 % Va — 0,390 *x Viri — 3,328 + e, 
R? = 0,40 ; n = 70 ; SCRU = 63742,31 (non contraint) 


Va = —0,174 % ÿ15-1 + 0,297 + 2-1 — 13,30 + 6 
R2=0,21 ;n =71; SCRR = 84586,73 (contraint) 
___ (84586,73 — 63742,31)/1 
7 84586,73/(70 — 3 — 1) 


F* > FË & 4, on refuse l'hypothèse HO, y141 explique significativement la 
variable y, , il y a donc causalité au sens de Sims de y, vers y1,. 


% 


= 21,58 


Nous observons une divergence dans ces tests, en ce qui concerne la causalité de y1, 
sur y», ; le test de Granger nous fait rejeter l’hypothèse de causalité et celui de Sims lais- 
se présager d’un lien de causalité de type feedback : les prix de la période suivante 
influencent la demande de la période actuelle, s’agit-il d’une anticipation des agents ? 
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a Cointégration 
et le modele 
à correction d'erreur 


analyse de la cointégration, présentée par Granger (1983) et Engle 
et Granger (1987), est considérée par beaucoup d'économistes 
comme un des concepts nouveaux les plus importants dans le 
domaine de l'économétrie et de l'analyse de séries temporelles. Dans ce 
chapitre, nous abordons en section |. des exemples permettant une intro- 
duction au problème de la cointégration. La section Il. est consacrée à la 
présentation de la cointégration en termes de définition et de spécifica- 
tion. Les tests de cointégration ainsi que les méthodologies d'estimation 
sont ensuite développés dans le cas à deux variables (section Il.) et enfin 
(section IV) dans les cas à k variables. 


xemples introductifs 


— Premier exemple 
Soit les variables y, et x, définies de la manière suivante : 


y = 1 avec comme variable explicative : x; = 1 
ÿ = 2 avec comme variable explicative : x, = 2? 


ÿ, = n avec comme variable explicative : x, = n°? 
La tendance de y, est de type linéaire et celle de x, est quadratique. 
Le résultat de la régression de y, sur x;(n — 30) conduit à l’estimation suivante : 
Y = 5,92 + 0,03x, 
(8,5) (19,8) 
R° = 0,94 — DW = 0,057 
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Les coefficients de régression sont significatifs, la valeur du R? est élevée, 
cependant il apparaît évident que ce modèle a un pouvoir prédictif très mauvais. 
En effet, sur le plan statistique, la statistique de Durbin et Watson (proche de 0) 
présage d’une autocorrélation forte des erreurs!. 


Ce premier exemple illustre le danger d’interpréter et d’utiliser une régres- 
sion entre deux variables affectées de tendances déterministes de degré différent. 
Le graphique 1 présente la série brute (tendance linéaire) et la série ajustée par 
une tendance quadratique. 
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Graphique 1 — Régression d’une tendance linéaire 
sur une tendance quadratique 


— Deuxième exemple 

On génère deux processus aléatoires : 
M = inter avec €, — N(0; 1 ) 
X = Xi ter avec €, —> N(0; o°) 


Sur 1 000 régressions, nous obtenons les résultats suivants : 670 sont signi- 
ficatives d’après la statistique du # de Student, cependant la statistique de DW 
est toujours faible (la moyenne sur les 1 000 régressions est: DW = 0,33). 
Donc apparemment, ces régressions donnent de bons résultats (hormis la statis- 
tique DW). Mais ces résultats sont purement fortuits : ils découlent de la corré- 
lation entre les séries qui sont affectées d’une tendance stochastique. En effet, si 
on passe en différences premières (Ay, = f(Ax,)), plus aucune régression n’est 
significative. A 


AXx, = Xr — Xi] — Ex 


1. Cela souligne l’importance à ne pas oublier d’interpréter la statistique de Durbin et Watson. 
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En régressant une série non stationnaire (de type DS) sur une autre série du 
même type, on obtient des coefficients significatifs mais avec une statistique 
DVW proche de 0. Ce deuxième exemple illustre le risque de régresser entre elles 
deux séries affectées d’une tendance stochastique. Il faut donc toujours, au préa- 
lable, stationnariser des séries non stationnaires ; dans le cas contraire, il existe 
un risque de « régression fallacieuse » (« spurious regression >»). 


e concept de cointégration 


L'analyse de la cointégration permet d'identifier clairement la relation véritable 
entre deux variables en recherchant l’existence d’un vecteur de cointégration et 
en éliminant son effet, le cas échéant. 


ropriétés de l'ordre d'intégration d'une série 


Une série est intégrée d’ordre d (notée x, — 1(d)), s’il convient de la différen- 
cier d fois afin de la stationnariser!. 


Soit une série x,, stationnaire et une série x, intégrée d’ordre 1 : 


XX > I (0) 


Xi — 1() > Xir + x A 14) 


La série y, = x,, +x,, est non stationnaire puisque l’on somme une série 
affectée d’une tendance et une série stationnaire. 
Soit deux séries x,, et x, intégrées d’ordre d : 


Xi —> 1(d) 


9 
Xx — 1(d) > Xy + Xx — 10) 


La combinaison linéaire & x, + B x, — 1(?). 


En effet, le résultat dépend des signes des coefficients «, B et de l’existence 
d’une dynamique non stationnaire commune. 


Examinons un autre cas de figure : 


Xi —> 1(d) 


9 
x — 1(d') d'Æ£d > Xi + Xx > 10) 


Il s’avère impossible de conclure car on somme deux séries d’ordre d’inté- 
gration différent. 


1. Cf le test de Dickey-Fuller du chapitre 9 afin de déterminer l’existence d’une tendance sto- 
chastique ou déterministe et de rechercher les ordres d’intégration d’une série. 
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Soit deux séries affectées d’une tendance : 


— dans un premier cas, les deux séries ont une tendance d’évolution constan- 
te sur une première période et puis une tendance d’évolution divergente en 
une deuxième période, les séries ne sont pas cointégrées (cf. graphique 2) ; 

— dans un deuxième cas, les deux séries ont une évolution constante sur toute 
la période, les séries sont cointégrées (cf. graphique 3), il existe une évo- 
lution de long terme constante entre les chroniques. 
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Graphique 3 — Les variables x, et y, sont cointégrées 
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onditions de cointégration 


Deux séries x, et y, sont dites cointégrées si les deux conditions sont vérifiées : 


— elles sont affectées d’une tendance stochastique de même ordre d’intégra- 
tion d, 
— une combinaison linéaire de ces séries permet de se ramener à une série 
d'ordre d'intégration inférieur. 
Soit : svt) 
» > 1(d) 


tel que @; x, + 2 y, — 1(d — b), 
avec d>b>t0. 


On note : x,, y, — CI(d,b) 
où [«, æ] est le vecteur de cointégration. 


Dans le cas général à & variables, on a: 


Xi: > 1(d) 
a on note X, = [xi, 2, ... Xi] 
Xs > 1(d) 


s’il existe un vecteur de cointégration & = [a œ; ...a,] de dimension (k, 1)tel 
que &X, — 1(d — b), alors les k variables sont cointégrées et le vecteur de coin- 
tégration est æ. On note que X, — C1(d,b) avec b > 0. 


e modèle à correction d'erreur (ECM) 


Examinons le cas particulier suivant : x,, y, — C1(1,1) et [B, —1] (on normali- 
di le 

se en posant B = = goit B x, — y, — I(0)) est le vecteur de cointégration. 
2 

Dans ce type de spécification, le fait que les séries soient cointégrées et non sta- 

tionnaires soulève un problème d’estimation. La bonne qualité statistique du 

modèle (R? élevé et coefficients significatifs) est due au fait que les séries sont 

non stationnaires (puisque cointégrées). En régression directe de y, sur x, — 

lorsque y, x; — C1(1,1) — l’utilisation de ce modèle à des fins prévisionnelles 

s’avère désastreuse ; en effet, la relation mise en évidence par cette régression 


n’est pas réelle, elle découle simplement d’une relation entre deux tendances!. 


Le problème est donc, d’une part de retirer la relation commune de cointé- 
gration (la tendance commune), d’autre part, de rechercher la liaison réelle entre 


1. Cf. les exemples introductifs sur les problèmes de régressions fallacieuses. 
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les variables : c’est l’objectif du Modèle à Correction d’Erreur (ECM!). Cette 
représentation est à la fois un modèle statique (B, À x,) et un modèle dynamique 


(Br: — B Xx;-1)). 


Nous pouvons spécifier la relation : Ay, = Bi A x, + Bi(y;_1 — B X;_1) 
ICO) (0) I(0) 


Autour de la relation de long terme, le modèle à correction d’erreur permet 
d'intégrer les fluctuations de court terme. Le coefficient B, — qui doit être néga- 
tif — rend compte d’une force de rappel vers l’équilibre de long terme. 


Le graphique 4 illustre la relation de long terme entre x, et y,(y, — Bx, = 0), 
cette ligne représente l’équilibre de long terme du système ; la zone d’évolution 
du système en dehors de l’équilibre (dynamique de court terme) est définie par 
l’erreur constatée entre y,_, et x,_1. 


70 72 74 76 8 80 82 84 86 E8 JU 92 94 
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Graphique 4 — Représentation du modèle à correction d’erreur 


ointégration entre deux variables 


Le traitement de séries chronologiques longues impose de tester une éventuelle 
cointégration entre les variables. En effet, le risque d’estimer des relations 
« fallacieuses » et d’interpréter les résultats de manière erronée est très élevé. 
Nous allons tout d’abord examiner le cas à deux variables : test de cointégration 
et estimation du modèle à correction d’erreur. 


1. Nous utilisons l’abréviation anglo-saxonne « Error Correction Model >. 
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est de cointégration entre deux variables 


Nous reprenons ici l’algorithme en deux étapes de Engle et Granger. 


— Étape 1 : tester l’ordre d'intégration des variables 


Une condition nécessaire de cointégration est que les séries doivent être inté- 
grées de même ordre. Si les séries ne sont pas intégrées de même ordre, elles ne 
peuvent pas être cointégrées. 


Il convient donc (cf. tests de Dickey-Fuller et Dickey-Fuller Augmenté) de 
déterminer très soigneusement le type de tendance déterministe ou stochastique 
de chacune des variables, puis l’ordre d’intégration d des chroniques étudiées. 
S1 les séries statistiques étudiées ne sont pas intégrées de même ordre, la procé- 
dure est arrêtée, il n’y a pas de risque de cointégration. 

Soit : 

x, — 1(d) et y, — 1(d) 


— Étape 2 : estimation de la relation de long terme 


S1 la condition nécessaire est vérifiée, on estime par les MCO la relation de 
long terme entre les variables : y, = a; x, + ao + 4. 


Pour que la relation de cointégration soit acceptée, le résidu e, issu de cette 
régression doit être stationnaire : e, = y, — @ x, — @. 


La stationnarité du résidu est testée à l’aide des tests DF ou DFA (cf. chapitre 9). 


Dans ce cas, nous ne pouvons plus utiliser les tables de Dickey et Fuller. En 
effet, le test porte sur les résidus estimés à partir de la relation statique et non 
pas sur les « vrais » résidus de la relation de cointégration. MacKinnon (1991) 
a donc simulé des tables qui dépendent du nombre d’observations et du nombre 
de variables explicatives figurant dans la relation statistique. 


S1 le résidu est stationnaire nous pouvons alors estimer le modèle à correc- 
tion d’erreur. 


stimation du modèle à correction d'erreur 


Lorsque des séries sont non stationnaires et cointégrées, il convient d’estimer 
leurs relations au travers d’un modèle à correction d’erreur (ECM, « Error 
Correction Model »). Engle et Granger (1987) ont démontré que toutes les 
séries cointégrées peuvent être représentées par un ECM (théorème de la repré- 
sentation de Granger). 


Nous allons présenter la méthode la plus répandue d’estimation d’un ECM. 
Nous nous bornons, ici, au cas d’une seule variable explicative. La généralisa- 
tion à k variables est abordée à la section suivante. 
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Soit les séries y, et x, — 1(1),l’estimation par les MCO de la relation de long 
terme indique une stationnarité du résidu. Les séries y, et x, sont donc notées : 
CI(1, 1). 


Nous pouvons, dès lors, estimer le modèle à correction d’erreur. 


Estimation du modèle à correction d'erreur (ECM) en deux étapes 
— Étape 1 : estimation par les MCO de la relation de long terme : 
m=@+Bx+e (ECM) [1] 


— Étape 2 : estimation par les MCO de la relation du modèle dynamique 
(court terme) : 


AY: — di Ax, +oe;_ +u; 2 < 0 [2] 


Le coefficient «, (force de rappel vers l’équilibre) doit être significativement 
négatif ; dans le cas contraire, il convient de rejeter une spécification de type 
ECM. En effet, le mécanisme de correction d’erreur (rattrapage qui permet de 
tendre vers la relation de long terme) irait alors en sens contraire et s’éloignerait 
de la cible de long terme. La procédure en deux étapes conduit à une estimation 
convergente des coefficients du modèle et les écarts types des coefficients peu- 
vent s’interpréter de manière classique!. 


L’estimation d’un modèle à correction d’erreur ne pose donc pas de problè- 
me particulier et nécessite simplement le recours à une technique de moindres 
carrées ordinaires. 


En cas de variables explicatives supplémentaires dont l’hypothèse de cointé- 
gration ne peut pas être retenue (comme des variables indicatrices par exemple), 
la procédure d’estimation est la même sauf pour l’estimation du modèle [1] 
(équation de long terme) dans lequel figurent ces variables explicatives. 


Exercice n° 1 
LH, fichier C11EX1 


Test de cointégration et estimation d’un modèle à correction 
d’erreur 


Soit deux séries statistiques y, et x; dont les observations sont présentées au 
tableau 1. On demande d’estimer la relation entre ces deux variables 
Gr = & + x, +e,) en testant une éventuelle cointégration (dans ce cas estimer le 
modèle à correction d’erreur). 


1. Engle et Granger, 1987. 
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Tableau 1 — Valeurs observées de x, et y, (extrait des données) 


Obs Xt Yr 
1 0,000 10,890 
2 2,851 12,188 
29 6,744 12,347 
30 7,270 15,194 


Solution 


La première étape consiste à étudier les propriétés des deux séries en termes de sta- 
tionnarité. Le tableau 2 présente les résultats des tests : 


— de Dickey-Fuller (aucun retard n’est significatif dans l’éventualité d’un test de 
Dickey-Fuller Augmenté), 


— de Phillips-Perron (troncature = 2), 
— et de XPSS (troncature = 2). 
Ces tests sont présentés au chapitre 9. 


Tableau 2 — Résultats des tests de Dickey-Fuller, Phillips-Perron et KPSS 


Test Type de Modèle | x, en niveau — f statistique |y, en niveau — f statistique 

Test DF [1] 0,81 0,17 
Test DF [2] —0,05 —2,67 
Test DF [3] —0,82 —3,05 
Test PP [1] 0,88 0,62 
Test PP [2] —0,11 —2,60 
Test PP [3] —0,80 —2,96 

x; en niveau — y, en niveau — 

LM statistique LM statistique 
Test KPSS [2] 0,53 0,39 
Test KPSS [3] 0,22 0,20 


La comparaison des 3, calculés aux f lus (Tables de MacKinnon) ou des LM statis- 
tiques aux valeurs critiques indique que les deux séries x, et y, sont non stationnaires en 
niveaul. Des tests similaires sur les différentes premières de x, et y, indiquent qu’elles 
sont stationnaires, les deux séries étudiées sont / (1), il existe donc un risque de cointé- 
gration. 


Le test de cointégration est effectué à partir du résidu d’estimation du modèle : 
Ye = di X + do + E& 
Soit : y, = 0,55x, + 10,38 +e, 
(6,3) (41,46) 
n=30; R°=0,58: (.) = 1 de Student. 


1. Nous rejetons l’hypothèse d’une tendance déterministe. 
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Nous pouvons vérifier que le résidu est bien stationnaire, il existe donc un risque de 
cointégration entre les deux variables. 


Test DF Test PP ({ —2) 
2 Modèle [1] Modèle [2] Modèle [1] Modèle [2] 


ts, 5,39 -5,30 -5,42 =5,31 


Nous procédons donc maintenant à l’estimation du modèle à correction d’erreur. 


Nous calculons, d’abord, le résidu (provenant du modèle précédent) décalé d’une 
période, soit : e_1 = y;-1 — 0,55x;_1 — 10,38 
Puis nous estimons (par les MCO) le modèle : 
AY; = di AX; + Oes_1 +u; 
Ay, = 0,610 Ax, — 1,02 e;_; +%, 
(3,09) (5,22) 
n=29; R?2=0,60; (.)=1 de Student. 


Le coefficient (terme de rappel) de e,_, est bien significativement négatif, la repré- 
sentation à correction d'erreur est validée. 


énéralisation à k variables 


La littérature économique récente concernant la théorie de l’équilibre démontre 
qu’une série macro-économique stationnaire peut être le résultat d’une combi- 
naison de variables non stationnaires, d’où l’importance actuelle de l’analyse de 
la cointégration à 4 variables. La généralisation de deux à & variables s’avère 
assez complexe du fait du nombre de possibilités de vecteurs de cointégration 
possibles. 


a cointégration entre k variables 


Dans un modèle économétrique à k variables explicatives : 
Ve Bo + Bi Xi + Ba Xe +... + Br Xx + € 


si les variables (y, et x;,) sont non stationnaires, 7 (1) par exemple, il existe alors 
un risque de cointégration. En effet, l’existence d’une éventuelle cointégration 
implique que les variables doivent être non stationnaires!. Comme dans le cas à 


1. Généralement, en économie, les variables sont 7 (1) ; cependant certaines séries financières 
peuvent être de type 7 (2). 
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deux variables, si une combinaison linéaire de ces variables est stationnaire, 
elles sont alors cointégrées. L’estimation par les MCO du modèle permet de cal- 
culer le résidu : 


€ = Yi — Bo — Bi Xi — ... — Bx Xxr 
S1 ce résidu est stationnaire, nous acceptons l’hypothèse d’une cointégration 
entre les variables. Les tests de Dickey-Fuller de stationnarité sur le résidu doi- 
vent s’effectuer à partir des valeurs critiques tabulées par MacKinnon (1991) en 
fonction du nombre de variables total du modèle. Le vecteur de cointégration est 
donné par : [1, —Bo, —B1,..., —Bx]. 


Cependant, le cas multivarié est plus complexe que le cas à deux variables du 
fait des possibilités combinatoires de cointégration. En effet si, par exemple, les 
variables y,, x1,, x et x: Sont cointégrées par paires y, x1, > CI(1,1) et x», 
x3 — CI(1,1), leur combinaison linéaire est (0). 


Nous avons : e! = y, — &o — dixy et €? = xx — Yo — Jixz et par conséquent : 
1 À _S a. S a. 
e=e, +e = y; — Qo — Ai Xi + Xx — Vo — Vi Xy — 1 (0) 


Nous obtenons, dans ce cas de figure, un autre vecteur de cointégration pos- 
sible : [1, —@ — %, —@, 1, —ÿ]. D’une manière générale, dans un modèle à une 
variable à expliquer et k variables explicatives (soit k + 1 variables au total), il 
peut exister k vecteurs de cointégration linéairement indépendants. Le nombre 
de vecteurs de cointégration linéairement indépendants est appelé le rang de la 
cointégration. 


Si les variables sont de même ordre d’intégration — Z(1) par exemple — 
l’existence d’un seul vecteur de cointégration est possible ; en revanche, si les 
séries ne sont pas toutes intégrées du même ordre, nous pouvons être certains 
que le vecteur de cointégration n’est pas unique. 


De manière pratique, pour tester une éventuelle cointégration entre plusieurs 
variables, il convient tout d’abord de la tester sur l’ensemble des k + 1 variables, 
puis — en cas de cointégration — de la tester par combinatoire entre les variables. 


stimation du modèle à correction d'erreur 


La cointégration ayant été révélée par les tests précédents, deux cas de figure 
sont à envisager : 


— il existe un vecteur unique de cointégration, 


— plusieurs vecteurs de cointégration existent. 


Si le vecteur de cointégration est unique, nous pouvons employer les 
méthodes d’estimation envisagées à la section précédente, par exemple, celle en 
deux étapes de Engle et Granger. 
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— Étape 1 : estimation par les MCO de la relation de long terme et calcul du 
résidu : 
ES res ER 
— Étape 2 : estimation par les MCO de la relation du modèle dynamique 
(court terme) : 
AY, = Qi A Xi + A Xy +... + GA Xy + Vi @1 + Us 
Le coefficient y, (force de rappel vers l’équilibre) doit être, comme dans le 
cas à une variable explicative, significativement négatif. 


Cependant, le plus souvent, le vecteur de cointégration n’est pas unique et la 
méthode de Engle-Granger n’est plus valide. En effet, les estimateurs des MCO 
ne sont plus consistants quels que soient les vecteurs de cointégration. Nous 
devons, dans ce cas, faire appel à la représentation vectorielle à correction d’er- 
reur (VECM, « Vector Error Correction Model »). 


e modèle à correction d'erreur vectoriel 


Examinons au préalable le cas d’un processus VAR(2) à k variables sous forme 
matricielle : 


Y, = Ao+ AY; + AŸ:+e 
avec : 


Y, : vecteur de dimension (k x 1) constitué des k variables (y1,,y2 ..., Yu), 
À, : vecteur de dimension (k x 1), 
À; : matrice de dimension (k x k). 


Ce modèle peut s’écrire en différence première : 
Y, Yi = A+ AY; —Y + AY +e 
AY, = A5+(A—1)Y; + AY :+e [3] 


Afin de faire apparaître des différences premières à droite de l’équation, nous 
ajoutons et soustrayons A,Y,_, — Y;_, de la manière suivante 


AY, = A5+(A—1)Y;; + AY: -7Y,—A;Y,, +Y:+AY+e 
AY, = A5 + AV — Ye + AY — Yo — Ai, +Y2+ AY, o+e [4] 


Or AY = Yi — Yi. 


En regroupant les termes en AY, ; et après simplification, on obtient : 


AY, = A5 + (Ai — T)AY, + (Ai+A—1)Y;+e [5] 


308 e ÉCONOMÉTRIE 


Cependant, afin de faire figurer les relations de cointégration — qui relient 
entre elles les variables en niveau décalées d’une période — nous cherchons à 
écrire l’équation [4] en fonction de Y, ;, soit dans l’équation [3] nous pouvons 
ajouter et soustraire AY, , et après simplification nous obtenons : 


AY, = A5 — A AY, +(A+A—-1)Y ;+e [6] 
Ou encore : 
AY, = Ao+ BAY; ++ [7] 
avec : A = —-B, et 7 =(A; +A,—1). 
Ce résultat peut être généralisé à une représentation VAR(p) à & variables 
sous forme matricielle : 
Peas A Ti LATS, pR... HA re 
avec : 
Y, : vecteur de dimension (k x 1) constitué des k variables (y1,,y2 ..., Yu), 


À, : vecteur de dimension (k x 1), 
À; : matrice de dimension (k x k). 


Ce modèle peut s’écrire en différences premières de deux manières : 
AY, — Ào + (A: cn DAY, + (A: + À; ee DAY, + «5 SE 


(A, Huis + À; + À; = DAY, y +rY., + € 
ou encore en fonction de Y,_, : 


AY, = A5 + BAY, + BAY, +... + B,- AY,» +rY+e 


P 

Les matrices B; étant des fonctions des matrices À; et 7x — os A; —1 ) 

i=1 

La matrice x peut s’écrire sous la forme x = «B' où le vecteur « est la force 
de rappel vers l’équilibre et B le vecteur dont les éléments sont les coefficients 
des relations de long terme des variables. Chaque combinaison linéaire repré- 
sente donc une relation de cointégration. 

S1 tous les éléments de x sont nuls (le rang de la matrice x est égal à 0 et donc 
A1 +. + A2 + À; = 1), alors nous ne pouvons pas retenir une spécification à 
correction d’erreur, nous estimons un VAR classique en différences premières 
afin d’éliminer les tendances. Si le rang de x est égal à k, cela implique alors que 
les variables sont toutes 7 (0) et le problème de la cointégration ne se pose donc 
pas, 1l convient d’estimer un modèle VAR en niveau. 


Si le rang de la matrice x (noté r) est compris entre 1 et k—1 
(1 <r<k—1), alors il existe r relations de cointégration et la représentation 
ECM est valide soit : 


AY, = A + B,AY,_; + B;, AY, ; + a. + B,_,AY,_ 4 + de;-; + € 


avec e, = B'Y. 
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Exemple de spécification : soit un processus VAR(2) à trois variables y:,, »2, et 
»3. et une relation de cointégration, le VECM s’écrit alors : 


Air = aÿ + bi Air + DAY + DA arr + Œ(Prst — BaYasi — B3Yar-1 — Bo) + €! 
AY: = ai T DAY 1 EL DS AY1-1 + DA Y3 1 Ge COTE — Bari — B3Y31-1 — Bo) + e? 


AY = ai + DA Yi + DAY 1 + DA ÿ3 1 + (pre — BaYasi — BsY34 1 — Bo) + e? 


Nous avons normalisé l’équation de cointégration par rapport au coefficient 
de yis. 

Selon les caractéristiques des données traitées, ce processus VAR peut 
connaître les variantes suivantes : 

— existence d’une constante soit dans la relation de cointégration (8) soit 
dans le VAR (ai), 

— existence d’une tendance (1 = 1,2,...,n) dans le VAR et/ou dans la rela- 
tion de cointégration, 

— ou encore intégrer des variables exogènes de type indicatrice pour corriger 
d’un mouvement saisonnier. 

Sur ce type de modèle, nous ne pouvons pas appliquer la méthode des MCO 
car nous avons des problèmes d’identification similaires à ceux évoqués lors du 
chapitre 8 concernant les modèles à équations simultanées. Il convient d’em- 


ployer une méthode du maximum de vraisemblance!. 


ests de relation de cointégration 


Pour déterminer le nombre de relations de cointégration, Johansen (1988) pro- 
pose deux tests fondés sur les valeurs propres d’une matrice issue d’un calcul 
en deux étapes : 


Etape 1 : calcul de deux résidus u, et v. 

Nous effectuons deux régressions : 

Première régression : 

AP A ANA TE AA TUE LR A AT 24 
Deuxième régression : 

Pi = A+ A AT. + AA, +...+ A A7, +u 


Vis 
V2 
Avec Y, — 


Ver 


1. Johansen, 1988. 
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Nous avons les mêmes variables explicatives, seule la spécification du bloc 
de la variable à expliquer est modifiée. 


u, et v, sont donc les matrices des résidus de dimension (K, n) avec k = nombre 
de variables, ñn = nombre d’observations. 


Etape 2 : calcul de la matrice permettant le calcul des valeurs propres 


Nous calculons quatre matrices des variances-covariances de dimension 
(k, k) à partir des résidus u, et v.. 


Du = (1/7) Su 
S = (1/n) S_v 


Sy = (1/7) NT 


$,, = (1/7) D vu! 


Puis nous extrayons les k valeurs propres de la matrice M de dimension K, k 
calculée de la manière suivante : 
M=5 2,2, 2 
1) Test de la trace 


A partir de ces valeurs propres, on calcule une statistique : 
k 


trace = —N >. Ln (1 — À;) avec n — nombre d’observations, À; = i** valeur 
i=r+1 
propre de la matrice M, & = nombre de variables, r = rang de la matrice. 


N NS 


Cette statistique suit une loi de probabilité (similaire à un x?) tabulée à 
l’aide de simulations par Johansen et Juselius (1990). Ce test de Johansen fonc- 
tionne par exclusion d’hypothèses alternatives : 


— rang de la matrice x égal 0 (r = 0), soit HO : r =0 contre H1: r > 0 ; 
si HO est refusé, on passe au test suivant! (si A > à la valeur critique lue 
dans la table, on rejette HO) ; 

— rang de la matrice x égal 1 (r = 1), soit HO: r =1 contre H1: r > 1 ; 
si HO est refusé, on passe au test suivant ; 

— rang de la matrice x égal 2 (r =2), soit H0 : r =2 contre H1: r >2 ; 
si HO est refusé, on passe au test suivant, etc. 


Si, après avoir refusé les différentes hypothèses HO à la fin de la procédure, 
on teste HO : r = k — 1 contre H1 : r = k et que l’on soit amené à refuser HO, 
alors le rang de la matrice est r = k et il n’existe pas de relation de cointégra- 
tion car les variables sont toutes J (0). 


Les logiciels d’économétrie fournissent directement l’ensemble de ces informa- 
tions : la statistique 1... calculée entre 1 et k ainsi que les valeurs critiques associées. 


1. Dans le cas contraire, la procédure est arrêtée, et le rang de la matrice est r = 0. 
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Pour mener ce test, Johansen propose cinq spécifications concernant soit les 

vecteurs cointégrants soit les séries (le VAR proprement dit) : 

Absence de tendance linéaire dans les données (les séries sont toutes DS sans 

dérive) : 

a) Absence d’une tendance linéaire dans les séries et d’une constante dans les 
relations de cointégration (la constante dans la relation de long terme est non 
significative). 


Exemple : Ayis-1 = bi Aÿis-1 + DA 1 + bi Ai 
+o (Vis — BrY21-1 — B3Y31-1) + e| 


b) Absence d’une tendance linéaire dans les séries mais présence d’une constan- 
te dans les relations de cointégration (la constante dans la relation de long 
terme est significative). 


Exemple : Ayi; = bi AY + b, AYii1 + b; AY3-1 
HA (Dirt — BoYas-1 — B3Y3-1 — Bo) + €} 
Présence d’une tendance linéaire dans les données (au moins une série est un 


DS avec dérive) : 


c) Présence d’une tendance linéaire dans les séries et d’une constante dans les 
relations de cointégration. 


Ex. : Ayis = a) + bi Aÿis1 + DA Ya + bi AY 
Ho (Vis-1 — BrY2r-1 — B3Y3-1 — Bo) + €! 


d) Présence d’une tendance linéaire dans les séries et dans les relations de coin- 
tégration (au moins une série est un TS). 


EX : AYi —= ay + b'AYÿis 1 + DAY: 1 + bi A y 
FO is = BaVaser — BsVist = Bot CO FE 


Présence d’une tendance quadratique dans les données : 


e) Présence d’une tendance quadratique dans les séries et d’une tendance linéai- 
re dans les relations de cointégration. 
Ex : Ai, = 49 + bt + bi Air + bi Ar + biAYsr 1 
Ho (iri — BYas-1 — BaY3-1 — Bo + ct) +} 
Le choix d’une de ces spécifications s’effectue en fonction des données et de la 


forme supposée de la tendance (une analyse des propriétés stochastiques des 
séries ou un simple examen visuel des graphiques permettent de se déterminer). 


Le tableau 3 synthétise le choix de la spécification du VECM en fonction de 
la typologie des processus. 
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Tableau 3 - Choix de la spécification en fonction du type de processus 


Type de processus Spécification 
1 2 3 4 5 
Tous les processus sont des DS sans dérive X X 
Au moins un des processus est un DS avec dérive X 
Au moins un des processus est un TS X 
Au moins un processus a une tendance quadratique X 


2) Test de la valeur propre maximale 


Le deuxième test proposé par Johansen est donné par la statistique : 
Amax = —1LOg(1 — À,,1) r =0,1,2... 


Le test s’effectue comme précédemment de manière séquentielle par exclu- 
sion d’hypothèses alternatives. 

En cas de divergence des deux tests (valeur propre maximum et trace), nous 
privilégions le test de la trace dont la puissance est la plus élevée. 


est d'exogénéité faible 


Le test d’exogénéité faible consiste à vérifier si les variables sont bien endo- 
gènes. Ce test porte sur le coefficient « de la force de rappel (s’il existe une seule 
relation de cointégration) ou les coefficients & dans le cas de plusieurs relations 
de cointégration. Effectuer un test sur « revient à vérifier si la relation de coin- 
tégration figure dans toutes les équations du modèle. C’est un test d’exogénéité 
faible des différentes variables du système, pour les paramètres d’intérêt donnés 
par la relation de long terme de la matrice x = «'B, c’est-à-dire B les relations 
de cointégration et « les poids de ces relations dans chacune des équations du 
système. 
Prenons par exemple un VECM à deux relations de cointégration : 


AYu AY ii Xi Vir-1 
Bu Ba PB 

Aÿy |= AT Aysi + as a» V1 
Bi Bn By 

AY3 AY3-1 ds Az V3r-1 


Pour tester l’exogénéité de la variable y.,, il convient d’effectuer le test d’hy- 
pothèse HO : œ = à» = 0, si l'hypothèse HO est acceptée cela signifie que la 
force de rappel « n’intervient dans aucune relation de cointégration et donc que 
la variable y;, est faiblement exogène. Dans ce cas nous estimons un VECM par- 
tiel en imposant la contrainte &1 = œ» = 0. 
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Ce test est réalisé par le calcul de la statistique du ratio de vraisemblance du 
modèle contraint sous HO et non contraint. 


ynthèse de la procédure d'estimation 


Nous essayons ici de synthétiser les grandes étapes relatives à l’estimation d’un 
modèle VECM. 


Étape 1 : Détermination du nombre de retards p du modèle (en niveau ou en 
Log) selon les critères AIC ou SC (cf. chapitre 10). 

Étape 2: Estimation de la matrice II et test de Johansen permettant de 
connaître le nombre de relations de cointégration (les logiciels proposent un cer- 
tain nombre de spécifications alternatives, telles que l’existence d’un terme 
constant dans la relation de cointégration, contraindre À, = 0, l’existence d’une 
tendance déterministe, etc.). 

Étape 3 : Identification des relations de cointégration, c’est-à-dire des rela- 
tions de long terme entre les variables. 

Étape 4 : Estimation par la méthode du maximum de vraisemblance du 
modèle vectoriel à correction d’erreur et validation à l’aide des tests usuels : 
significativité des coefficients! et vérification que les résidus sont des bruits 
blancs (test de Ljung-Box), tests d’exogénéité faible. 


Enfin, nous pouvons vérifier que l’estimation par les MCO de la relation de 


long terme fournit des résultats à peu près similaires (en termes de significativi- 


té et de valeurs estimées des coefficients) à ceux obtenus par la méthode du 


maximum de vraisemblance?. 


Exercice n° 2 
LL, fichier C11EX2 


Tests de cointégration et estimation d’un modèle vectoriel 
à correction d’erreur 


Soit trois variables y1,, 2, et y, observées sur 30 périodes dont les données sont 
consignées au tableau 3. On demande de tester une éventuelle cointégration et d’estimer 
un modèle VAR ou un modèle vectoriel à correction d’erreur s’il y a lieu. 


Solution 


— Première étape : détermination du nombre de retards de la représentation VAR en niveau 
(la transformation logarithmique ne s’impose pas au vue des données (cf graphique 5) 


1. Évidemment on tolère que quelques coefficients ne soient pas significativement de 0. 
2. De manière asymptotique, les deux estimateurs sont équivalents 
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Graphique 5 — Représentation de Yu, Ya et Ya 


Tableau 4 — Données observées de yy, y1 et y (extrait des données) 


OBS Jir Dr V3 
20,00 20,00 30,00 
2 21,39 17,05 31,40 
29 26,04 24,61 31,84 
30 26,70 23,25 32,22 


Le calcul des critères d’information AIC et SC pour des retards allant de 1 à 3 - nous 
n’allons pas plus loin compte tenu du faible nombre d’observations — ne pose pas de dif- 
ficulté. 


AIC(1) = 2,45; SC(1) = 2,88 
AIC(2) = 1,93; SC(2) = 2,78 
AIC(3) = 2,04; SC(3) = 3,34 


Le retard retenu est donc de 2 (minimum des critères AIC et SC), nous allons donc 
procéder au test de Johansen sur un VECM(1). 


— Deuxième étape : Test de Johansen 
Nous procédons au test de Johansen sous deux hypothèses : 


a) Existence d’une constante dans la relation de long terme et non dans les données 
(pas de tendance déterministe), spécification b. 


Détaillons ce premier cas. 
Premier test : Rang de la matrice x égal 0 (r = 0), soit HO : r = 0 contre H1 : r > 0. 


Les trois valeurs propres de la matrice x, estimée par le maximum de vraisemblan- 
ce, sont égales à À, = 0,605 ; À = 0,257 ; À3 = 0.139. 
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k 
Calculons la statistique de Johansen : Awace = —n + LEn(1—À;) pour r =0: 
i=r+1 


Mrace = 2 X {En (1 — A1) + En (1 — 2) + Ln (1 — À3))} 


Are = —28 X {0,928 + 0,297 + 0,150} = 38,50 


Les valeurs critiques sont égales à 34,91 pour un seuil de 5 % et 41,07 pour un seuil 
de 1 % ; on rejette donc l’hypothèse HO, le rang de la matrice n’est pas 0 (les séries ne 
sont donc pas stationnaires). 


Rang de la matrice x égal 1 (r = 1), soit HO : r = 1 contre H1 :r > 1. 
Âtrace = —28 X {0,297 + 0,150} = 12,51 
Les valeurs critiques sont égales à 19,96 pour un seuil de 5 % et 24,60 pour un seuil 


de 1% ; on ne peut pas rejeter l’hypothèse HO ni à 5 % ni à 1 %, on considère donc que 
le rang de la matrice x est égal à 1. 


Nous acceptons donc l’hypothèse d’une relation de cointégration. 


b) Existence d’une constante dans la relation de long terme et dans les données, spé- 
fication c. 


Nous vérifions la robustesse de ce résultat sur cette autre spécification (compte tenu 
des données, les autres possibilités sont exclues). 


Les résultats sont les suivants : 


Valeur propre Âtrace Seuil critique à 5% Seuil critique à 5% 


0,603749 37,38888 29,68 35,65 
0,229311 11,46904 15,41 20,04 
0,138550 4,175870 3,76 6,65 


Là encore, on constate que le rang de la matrice n’est pas 0 (ligne 1), mais qu’en 
revanche, on ne peut pas rejeter l'hypothèse HO ni à 5 % ni à 1 % (ligne 2) dans l’hypo- 
thèse d’un rang de la matrice x égal à 1. 


Le test de la valeur propre maximale corrobore les résultats précédents : 


Hypothesized Max-Eigen 0.05 

No. of CE(s) Eigenvalue Statistic Critical Value Prob.** 
None * 0.603749 25.91984 21.13162 0.0098 
At most 1 0.229311 7.293174 14.26460 0.4550 
At most 2 * 0.138550 4.175870 3.841466 0.0410 


L'hypothèse d’une seule relation de cointégration est validée. 
- Troisième étape : estimation du modèle vectoriel à correction d’erreur 


Les deux spécifications précédentes sont estimées avec ou sans constante dans les 
données et donc, dans les deux cas, avec une seule relation de cointégration entre y1,, y2: 
et V3, 


La première spécification est rejetée du fait que les trois constantes des trois équa- 
tions ne sont pas significativement différentes de 0. 
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L’estimation finale du VECM sur 28 observations est donc la suivante : 


Aÿir = —0,85 X (y15-1 — 0,87 X y25-1 — 0,54 X y35-1 + 12,92) 
(2,64) (8,9) (7,D (4,19) 
+0,77 x Aÿis-1 — 0,71 X Aÿ2s-1 — 0,26 X Aÿs-1 
(2,82) (2,61) (1,07) 
Ar = 0,32 X (Vis-1 — 0,87 X 2,51 — 0,54 X ÿ3,5-1 + 12,92) 
(1,18) (8,9) (7,D (4,19) 
+ 0,10 X AYis-1 = 0,34 X AY2-1 = 0,08 X AY3-1 
(0,43) (1,44) (0,39) 
AY3 = 0,0089 X Oisi = 0,87 X Y21-10,54 X Y3,5-1 2 12,92) 
(0,03) (8,9) (7,D (4,19) 
+ 0,53 X AYis-1 = 0,46 X AY2-1 = 0,25 X AY3-1 
(2,16) (1,86) (1,13) 


Les chiffres entre parenthèses sont les # de Student. 


— Quatrième étape : Validation de la représentation vectorielle à correction d’erreur 


Les coefficients des termes de rappel ont bien le signe attendu (cependant seul le 
terme de rappel de l’équation est significatif) et les coefficients de la relation de long 
terme sont significatifs. 

Le fait que seul le coefficient «, soit significativement différent de 0, indique que les 
variables y, et y: sont faiblement exogènes ce qui est confirmé par le test de contrainte 
portant sur les coefficients de la force de rappel «1, æ et æ : 


Cointegration Restrictions : 
A(1,1)=0 A(2,D)=0 A(3,1) =0 


Not all cointegrating vectors are identified 


LR test for binding restrictions (rank = 1) : 


Chi-square(1) : 5,557 Chi-square(1) : 1,275770 Chi-square(1) : 0,001005 
Probability : 0,0184 Probability : 0,258687 Probability : 0,974714 


Nous acceptons l’hypothèse HO de nullité pour les coefficients 2 et 3. 
Le VECM partiel est estimé en imposant la contrainte œ; = &3 = 0. 
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Vector Error Correction Estimates 
Sample (adjusted) : 3 30 


Included observations : 28 after adjustments 


Cointegration Restrictions : 


Standard errors in ( ) & t-statistics in | ] 


A(3,1)=0, A(2,1) = 0 


Not all cointegrating vectors are identified 


LR test for binding restrictions (rank = 1) : 


Chi-square(2) 1.558967 

Probability 0.458643 

Cointegrating Eq : CointEql 

Y1(-1) 0.997283 

Y2(- 1) — 0.797187 

Y3(- 1) — 0.555922 

C 11.094414 

Error Correction : D(Y1) D(Y2) D(Y3) 

CointEql — 1.187476 0.000000 0.000000 
(0.20103) (0.00000) (0.00000) 
[- 5.907041] [ NA] [NA] 

D(Y1(- 1)) 0.813973 0.139232 0.527616 
(0.26543) (0.23701) (0.24591) 
[3.06663] [ 0.587451] [2.14553] 

D(Y2(- 1)) — 0.715308 — 0.372227 — 0.456821 
(0.26279) (0.23465) (0.24346) 
[- 2.72203] [- 1.58631] [- 1.87634] 

D(Y3(- 1)) — 0.299747 — 0.097043 — 0.244642 
(0.23644) (0.21113) (0.21906) 
[- 1.26773] [- 0.459641] [- 1.116791] 
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Quelques coefficients du modèle ne sont pas significatifs, cela était probable et ne 


remet pas en cause la validité globale du modèle. 


Enfin, les trois résidus issus de chaque équation sont des bruits blancs d’après la 
Q-statistique de Ljung-Box : 


— première équation : Q(12) = 5,87 (œ = 0,92) —+ Acceptation de HO ; 


— deuxième équation : Q(12) = 4,60 (œ = 0,97) — Acceptation de HO ; 


— troisième équation : Q(12) = 5,99 (æœ =0,92) —+ Acceptation de HO ; 


La spécification VECM est donc validée. 


ÉCONOMÉTRIE 


ntroduction 
à l'économétrie 
des variables 
qualitatives 


ous avons, lors des chapitres précédents (chapitre 3, partie 5), uti- 

lisé des variables explicatives particulières appelées variables 

dichotomiques!, dont la caractéristique est de prendre deux 
valeurs 0 ou 1. Leurs utilisations ne posent aucun problème en tant que 
variable explicative, en revanche lorsqu'elles sont utilisées en tant que 
variable à expliquer la méthode des moindres carrés ordinaires est 
défaillante. 
Dans ce chapitre, qui constitue une simple introduction? à l'économétrie 
des variables qualitatives, nous allons donc aborder, dans une première 
partie, la problématique particulière de l'économétrie des variables qua- 
litatives et les problèmes rencontrés dans ce type de modélisation. Puis 
nous présentons les modèles spécifiques lorsque la variable à expliquer 
est binaire tels que : décision d'acheter ou de ne pas acheter un produit, 
risque de défaillance de paiement, obtenir un diplôme, … Il s'agit des 
modèles à choix binaires (Probit et Logit). 
Puis, dans une troisième partie, nous abordons les modèles à choix mul- 
tiples (pour quel candidat voter, quel moyen de transport adopter, ..). 
Enfin, la quatrième partie est consacrée aux variables tronquées et cen- 
surées. 


1. Les termes de variables indicatrices, binaires, muettes, ou « dummy » sont aussi utilisés. 
2. Pour des développements, nous recommandons au lecteur de se référer au livre de Thomas A. 
« Économétrie des variables qualitatives », Dunod, 2002. 
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| es problèmes et les conséquences 
de la spécification binaire 


Le recours à des modèles et des méthodes d’estimation spécifiques lorsque la 
variable endogène est qualitative (dichotomique ou à choix multiples) est lié au 
fait que le modèle linéaire général ne peut pas s’appliquer dans ce contexte. 


Prenons l’exemple d’un modèle de régression simple permettant de relier le 
fait d’être, pour un individu i, propriétaire d’un logement à son revenu : 


= d+ax+e i=]l,..,n [1] 


avec : 
y; = une variable endogène (variable à expliquer) qui prend les valeurs 1 si l’in- 
dividu à est propriétaire de son logement et 0 dans le cas contraire, 


x, — une variable exogène (variable explicative) qui représente le revenu en 
euros de l’individu à, 


e, = l’erreur de spécification du modèle, 
& et a, = les paramètres à estimer. 


Ce modèle, appelé aussi modèle à probabilité linéaire, présente les proprié- 
tés suivantes. 


a) — En faisant l’hypothèse classique de l’espérance de l’erreur nulle : 


E(&;) = 0, alors E(y;) = ay + ax. 


b) — La valeur prévue de la variable à expliquer y; peut s’interpréter de la 
manière suivante : 


Soit P, = Prob(y; = 1), d’où Prob(y; = 0) = 1 — P, 
E(y:) = 1 x Prob(y; = 1) +0 x Prob(y; = 0) = P, 


Soit : P, = ao + aix; Vi, d’où le nom du modèle. 


c) — La variable y; ne pouvant prendre que deux valeurs (0 et 1), par voie de 
conséquence, l’erreur ne peut donc prendre que deux valeurs : 


e; = 1 — (a + ax;) avec la probabilité P, 


&; = —(a + &x;) avec la probabilité 1 — P, 
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La variance de l’erreur est donnée par : 


Var(e;) = E(e?) = P,x (valeur de &; si y, = 1)? + (1 — P,)x (valeur de 6; si 
Yi —= 0}?. 


D'où : Var(e;) = E(e;) = P, x (1 — a — ax) + (1 — P,) x (—ao — &x) 
Or P, = ay + ax; 


Var(e;) = E(e;) = P, x (1— P) + (1 — P) x (PY [21 


[3] 


Examinons les problèmes soulevés par l’application d’une méthode des 
moindres carrés ordinaires afin d’estimer ce modèle. 


Soit : Var(e;) = E(e?) = P, x (1 — P;) 


a) — Dans l’équation [1], le codage de la variable endogène (0 ou 1) est tota- 
lement arbitraire, par exemple si nous prenions un codage sous la forme (0 ou 


10) les valeurs estimées des coefficients a, seraient évidemment différentes 
(10 x &). 


Un examen graphique (cf. graphique 1) de la série à expliquer (y;) et de la 
série ajustée (ÿ,) illustre parfaitement la non adéquation de l’estimation linéaire 
des paramètres par la méthode des moindres carrés. 
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Graphique 1 — Série brute (y;) et de la série ajustée (ÿ;) 
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b) — Puisque l’erreur ne peut prendre que deux valeurs, elle suit donc une loi 
discrète, l'hypothèse de normalité des erreurs n’est donc pas vérifiée. 

c) — D’après la relation [3] : E(e?) = P, x (1 — P,), il existe de fait une hété- 
roscédasticité. Cependant nous ne pouvons pas appliquer la méthode des 
moindres carrés généralisés car P, dépend des paramètres & et a, du modèle. 


d) — Enfin, nous devons imposer une contrainte au modèle : 0 < P; — 
&o + &x; < 1 qui peut se révéler non compatible avec les données. 


Tous ces éléments indiquent clairement que nous sommes dans l’impossibi- 
lité d'utiliser la méthode des moindres carrés ordinaires. 


es modèles de choix binaires 


Les modèles de choix binaires (ou encore appelés modèles dichotomiques) sont 
utilisés dans des secteurs très divers dès que la variable à expliquer ne peut 
prendre que deux modalités, par exemple : 

— médecine : guérison ou non guérison, 

— marketing : achat ou non achat, 


— finance : remboursement du prêt ou non remboursement, défaillance d’une 
entreprise ou non défaillance, 


— science politique : répondre oui ou non à un référendum, voter pour X ou 
Y à une élection, 


— sociologique : réussir ou rater un examen, 
— etc. 


Dans un modèle de choix binaire, nous cherchons à modéliser une alterna- 


tive (y; = 0 ou 1) et donc à estimer la probabilité P, associée à l’événement 
Qi = 1). 


e modèle linéaire sur variable latente 


Les variables latentes sont une première réponse aux problèmes liés à l’utilisa- 
tion des moindres carrés ordinaires dans un modèle dont la variable à expliquer 
est binaire. 


Qu'est-ce qu'une variable latente ? I s’agit d’une variable continue non 
observable et représentative du phénomène étudié. Par exemple la richesse d’un 
individu peut être expliquée par le fait qu’il soit propriétaire ou non de son 
appartement. 
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On introduit donc la variable latente y* (la richesse) et on suppose que : 


1) l'individu à est propriétaire si sa richesse est suffisante, soit y; = 1 si 
0 


2) y* est une fonction linéaire des x;, y* = ao + &ix; + &:. 


La variable à expliquer binaire y; est alors définie par le modèle de décision 
suivant : 


m=1siy >0 
y: = 0 si y* < 0 
Intuitivement, cette règle de décision consiste simplement à supposer que la pro- 
portion des (y; = 1) est élevée pour as + aix; + €; > 0. 
Soit P, la probabilité que y* > 0. 
P; = Prob(}; = 1) = Prob(y; > 0) = Prob(a, + aix; + €; > 0) 
= Prob(s; > —(ao + a:x;)) 


Si la distribution de &; est centrée par rapport à la moyenne, nous avons 
l’équivalence : 


Prob(e; > —(ao + aix;)) = Prob(s; < ao + aix;) 
Soit : P, = Prob(y; = 1) = Prob(e; < ao + a;x;) 
L'ensemble de ces résultats peut être généralisé dans le cas d’un modèle à 
plusieurs variables. 


La probabilité P, dépend ainsi de la distribution du terme de l’erreur &; du 
modèle de décision, nous pouvons alors distinguer deux cas : 


— le modèle Probit si la fonction de répartition de l’erreur suit une loi nor- 
male, 


— le modèle Logit si la fonction de répartition de l’erreur suit une loi de type 
logistique. 


B. Les modèles Probit et Logit 


Dans un modèle Probit la fonction de répartition de l’erreur &; est donnée par : 


ag+a1xi 1 


—00 A 27 


2 
P. = e !/?dt 


Il s’agit d’une loi normale centrée et réduite N(0,1). 


La fonction logistique « Logit model » ou encore appelée courbe en « S » est 
donnée par l’expression suivante : 


Introduction à l’économétrie des variables qualitatives e 323 


P; = Prob(y; = 1) = Prob(y; > 0) = Prob(ao + ax; + 8; > 0) 
= Prob(e; > —(ao + ax;)) = (ao + aix) 


avec ®(.) la fonction de répartition de la loi logistique. 


exp(do + dix;) . 1 


P.=® >) = = 
Got ax) 1 +exp(ao + aix;) 1 + exp(—(ao + aix;)) 


Les propriétés de cette équation sont les suivantes, si &; > 0 : 


Lim P, — 1 et Lim P, — 0, ce qui assure bien que les valeurs de P, sont 


Xj— 00 Xj—>—00 


comprises entre 0 et 1, comme l’illustre le graphique 2. 


1,00 = 


Pi di 


xi 


Graphique 2 — La fonction logistique 


Nous pouvons observer, après une transformation analogue à celle de l’exer- 
cice 2 du chapitre 6, que la fonction Logit s’écrit : 


ER 
choix y; = 1. 


i 


P; P; ns ; 
Ln ( ) = }* = do + dix; + E; avec (: P ) la probabilité relative du 


Ces spécifications peuvent être généralisées dans le cas de plusieurs 
variables explicatives. 
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L’estimation des paramètres des modèles Probit ou Logit est effectuée à l’ai- 
de des algorithmes de maximisation d’une fonction log-vraisemblance!. Quels 
que soient les modèles retenus (Probit ou Logit) les résultats d’estimation sont 
relativement proches, cependant les coefficients estimés ne sont pas directement 
comparables. 


nterprétation des résultats et tests statistiques 


Contrairement aux modèles linéaires estimés par la méthode des moindres car- 
rés ordinaires pour lesquels les coefficients ont des interprétations économiques 
immédiates en termes de propension marginale, les valeurs des coefficients des 
modèles ne sont pas directement interprétables. Seuls les signes des coefficients 
indiquent si la variable agit positivement ou négativement sur la probabilité P. 


Cependant, il est possible de calculer les effets marginaux? afin de connaître 
la sensibilité de la variation d’une variable explicative sur la probabilité P.. 


La significativité des coefficients est appréciée à l’aide des ratios appelés « z- 
Statistique » car la distribution des rapports du coefficient sur son écart type ne 
suit pas une loi de Student, comme dans le modèle linéaire général, mais une loi 
normale. Cette z-Sfatistique S’interprète de manière classique à partir des pro- 
babilités critiques et permet la tenue de tous les tests de significativité concer- 
nant les coefficients. 


Afin de tester l'hypothèse : HO : a; = a; = a3 =... = a; = 0, nous utilisons 
le ratio du Log vraisemblance. Soit la statistique suivante : 


LR = —-2(Ln(Lz) —Ln(Ly)) avec L};— valeur de la fonction du Log- 
vraisemblance contrainte sous HO et Z;y; — valeur de la fonction du Log- 
vraisemblance non contrainte. 


LR suit, sous l’hypothèse nulle HO, une distribution d’un x? à k degrés de 
liberté. Si la statistique LR est supérieure au x? lu dans la table pour un seuil 
déterminé, généralement de 5 %, alors nous refusons l’hypothèse HO, le modèle 
estimé comporte au moins une variable explicative de significative. 

Compte tenu de la caractéristique de la variable à expliquer codée en 0 ou 1, 
le coefficient de détermination R°? n’est pas interprétable en termes d’ajustement 
du modèle, c’est pourquoi on utilise une statistique appelée le pseudo-R? don- 

Log(Lu) 


née par : R?=1 - ——- 
Log(Lae) 


1. Cf. Thomas A. « Économétrie des variables qualitatives », Dunod, 2002, pages 56-57. 
2. Cf. Thomas A. (2002), pages 60-61. 
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Exercice n° 1 


LT: fichier C12EX1 


Estimation des modèles Probit et Logit binaires explicatifs des fac- 
teurs de la réussite en Licence 


Nous avons relevé sur un échantillon de 60 étudiants inscrits en dernière année de 


Licence d’Économie, les variables suivantes susceptibles d’expliquer la réussite ou 


l’échec à l’examen de Licence (variable REUSSITE = 0 si échec, 1 sinon) : 


diant, 


GENRE = variable muette, (1 = masculin, 0 = féminin). 


Un extrait des données est présenté dans le tableau 1. 


Tableau 1 — Extrait de données 


NECONO = la note d’économétrie sur 20 obtenue en Licence, 


NMICRO = la note de micro-économie sur 20 obtenue en Licence, 


NENFANTS = variable discrète représentant le nombre de frères et soeurs de l’étu- 


OBS REUSSITE |NENFANTS | NECONO NMICRO GENRE 
1 0 2 3,6 0 1 
2 0 5 3,8 0 1 
59 1 16,2 12 
60 1 17 4 


On demande : 


1) d’estimer un modèle de type Logit permettant de prévoir la probabilité de réussite 
d’un étudiant en Licence, 


2) de comparer les résultats avec un modèle de type Probit et le modèle linéaire géné- 


ral, 


3) de donner la probabilité de réussite, à l’aide du modèle Logit estimé, pour un étu- 
diant dont les caractéristiques sont les suivantes : NENFANTS = 1 ; NECONO = 12; 
NMICRO = 13,5 ; GENRE = masculin. 


Solution 


1) Une première estimation d’un modèle Logit, conduit aux résultats suivants : 
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Dependent Variable : REUSSITE 
Method: ML - Binary Logit 
Included observations: 60 


Variable Coefficient Std. Error z-Statistic Prob. 
NENFANTS — 0.682523 0.378870 — 1.801470 0.0716 
NECONO 0.632062 0.239564 2.638382 0.0083 
GENRE — 3.761718 1.437068 — 2.617633 0.0089 
NMICRO 0.155322 0.188916 0.822173 0.4110 
C — 3.265634 2.020060 —1.616602 0.1060 


À la lecture des résultats, nous constatons que : 
— la variable NMICRO à une probabilité critique de 0,41, elle n’est donc pas signifi- 
cative, 
— la variable NENFANTS à une probabilité critique de 0,07, elle est donc faiblement 
significative. 
Nous procédons à une nouvelle estimation en retirant la variable NMICRO dont le 
coefficient n’est pas significativement différent de O. 


Les résultats complets fournis par Eviews sont les suivants : 


Dependent Variable : REUSSITE 
Method: ML - Binary Logit 
Included observations: 60 


Variable Coefficient Std. Error z-Statistic Prob. 
NENFANTS — 0.746742 0.378942 — 1.970596 0.0488 
NECONO 0.695857 0.231789 3.002112 0.0027 
GENRE — 3.634605 1.410945 — 2.576008 0.0100 
C — 2.859277 1.910377 — 1.496708 0.1345 
Mean dependent var 0.516667 S.D. dependent var 0.503939 
S.E. of regression 0.287086 Akaiïke info criterion 0.645890 
Sum squared resid 4.615432 Schwarz criterion 0.785512 
Log likelihood — 15.37669 Hannan-Quinn criter. 0.700504 
Restr. log likelihood  —41.55549 Ave. log likelihood — 0.25627 
LR statistic (3 df) 52.35761 McFadden R-squared 0.629972 
Probability(LeR stat) 2.51E-11 
Obs with Dep=0 29 Total obs 60 
Obs with Dep=1 31 


Avec : Ly = Log likelihood ; Le — Restr. log likelihood ; LR = LR statistic ; 
Lu/n = Ave. log likelihood. Le critère d’information de Hannan-Quinn permet des 
comparaisons entre les modèles (comme les critères de Akaiïke ou Schwarz) en termes 
d’arbitrage : apport d’information lié à l’ajout de variables explicatives et perte de degrés 
de liberté. En cas de modèle concurrent, celui ayant le plus faible critère d’information 
sera retenu. 
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a) Interprétation statistique 
Les coefficients sont tous significativement différents de 0, hormis le terme constant. 
La statistique de la Log vraisemblance est égale à LR = 52,35 que l’on compare à 
un x? lu dans la table à un seuil de 0,95 % et à 3 degrés de liberté, "+ = 9,28 < 52,35 
— rejet de HO. 
Le pseudo-R? est donné par : 
Log(Lu) —15,38 


R? = = — 
Log(Lr) —41,56 


1 — 0,37 = 0,63 


Le modèle est validé sur le plan statistique. 


Le logiciel Eviews propose une table permettant d'appréhender les qualités prévi- 
sionnelles du modèle sur l’échantillon en comparant la probabilité estimée pour un indi- 
vidu à d’être y; = 1(P (Dep = 1)) au seuil arbitraire de 50 % à la valeur observée des 
y; = 0 ou I. 


Dependent Variable : REUSSITE 

Method: ML - Binary Logit 

Included observations: 60 

Prediction Evaluation (success cutoff C = 0.5) 


Estimated Equation Constant Probability 
Dep=0 Dep=1 Total Dep=0 Dep=1 Total 
P(Dep =1) <=C 26 4 30 0 0 0 
P(Dep =1) > C 3 27 30 29 31 60 
Total 29 31 60 29 31 60 
Correct 26 27 53 0 31 31 


% Correct 89.66 87.10 88.33 0.00 100.00 51.67 
% Incorrect 10.34 12.90 11.67 100.00 0.00 48.33 
Total Gain* 89.66 —12.90 36.67 

Percent Gain** 89.66 NA 75.86 


Ici, pour les individus (29) pour lesquels y; = 0, le modèle indique que 26 individus 
ont une probabilité estimée de réussite inférieure à 50 %. Dans 89,66 % des cas, les 
échecs sont donc correctement prévus. 


Pour les individus (31) pour lesquels y; = 1, le modèle indique que 27 individus ont 
une probabilité estimée supérieure à 50 %. Dans 87,10 % des cas, les réussites sont cor- 
rectement prévues. 


Le taux d’erreur est donc faible. 
b) Interprétation économique 


Le modèle s’écrit : 


P; 
Ln (5) = —0,75 NENFANTS + 0,70 NECONO —3,63 GENRE -— 2,86 + e; 
1 — P, (1,97) (3,00) 2,57) 


(.) = z-Statistique 
e; = Résidu d’estimation 


— Le nombre de frères et soeurs du foyer agit négativement, les étudiants issus de 
familles nombreuses ont un taux de réussite plus faible. 


— La note d’économétrie est un facteur positif de réussite. 
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— Enfin, les étudiants de genre masculin réussissent en général moins bien (signe 
négatif) que les étudiants de genre féminin. 


2) Estimation d’un modèle Probit et du modèle linéaire général 


a) L’estimation d’un modèle Probit conduit aux résultats suivants : 


Dependent Variable : REUSSITE 
Method: ML - Binary Logit 
Included observations: 60 


Variable Coefficient Std. Error z-Statistic Prob. 
NENFANTS — 0.428197 0.219223 — 1.953247 0.0508 
NECONO 0.363148 0.110230 3.294454 0.0010 
GENRE — 1.824203 0.650426 — 2.804629 0.0050 
C — 1.491466 1.108767 — 1.345157 0.1786 


Les valeurs des coefficients sont de même signe mais différentes par rapport au 
modèle Logit car la spécification n’est pas la même. Cependant, nous pouvons retrouver, 
approximativement, les valeurs estimées du modèle Logit en multipliant chacun des 
coefficients des variables explicatives par la constante! 7/3 1,81. 


b) Sans tenir compte des spécificités du modèle à variable à expliquer binaire et en 
utilisant une méthode (non appropriée) des moindres carrés avec correction pour hété- 
roscédasticité, nous obtenons les résultats suivants : 


Dependent Variable : REUSSITE 

Method: ML — Binary Logit 

Included observations: 60 

White Heteroskedasticity-Consistent Standard Errors & Covariance 


Variable Coefficient Std. Error t-Statistic Prob. 
NENFANTS — 0.078499 0.037854 — 2.073727 0.0427 
NECONO 0.066672 0.016580 4.021299 0.0002 
GENRE — 0.295568 0.092934 — 3.180407 0.0024 
C 0.217243 0.235111 0.924003 0.3594 
R-squared 0.611335 F-statistic 29.36094 
Durbin-Watson stat 1.741795 Prob(F-statistic) 0.000000 


Les coefficients sont affectés du même signe que dans les modèles Probit et Logit, 
cependant le graphique des valeurs ajustées (cf. graphique 3) indique que les valeurs sont 
parfois négatives ou supérieures à 1 ce qui est évidemment incompatible avec la valeur 
d’une probabilité. 


1. Une littérature abondante concerne la comparaison entre les modèles Probit et Logit, cf. 
Amemiya T., 1981. 
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Graphique 3 — Séries brute et ajustée de la variable binaire « Réussite » 


3) Soit les caractéristiques de l’étudiant : NENFANTS = 1 ; NECONO = 12; 
NMICRO = 13,5 ; GENRE = masculin. 


Le modèle Logit estimé (la note de micro-économie ne figurant pas dans le modèle 
final, elle n’est pas intégrée dans le calcul, cf. question 1) est le suivant : 


P 
Ln (5) = — 0,75 NENFANTS + 0,70 NECONO — 3,63 GENRE -— 2,86 +e; 
1— P,; (1,97) (3,00) @,57) 
B, 
En re = —0,75 x 1 + 0,70 x 12 — 3,63 x 1 — 2,86 = 1,109 
Ê, ad 
$ = el19 = 3,033 — P, = 3,033/(1 + 3,033) = 0,75 


La probabilité de réussite de cet étudiant de licence est donc de 75 %. 


es modèles à choix multiples 


Les modèles à choix multiples sont une généralisation des modèles binaires. 
Dans ces modèles la variable à expliquer, qualitative, n’est donc plus binaire (0 
ou 1), mais multinomiale (ou polytomique) comme par exemple : 
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— le choix lors d’un vote entre quatre candidats, 


— la possibilité pour un bachelier de choisir de s’inscrire dans une prépara- 
tion aux concours des écoles, à l’université, dans un IUT, dans un BTS, 


— appartenir à une classe de revenu, 
— etc. 


Nous différencions, en fonction du type de la variable à expliquer, les 
modèles ordonnés et les modèles non ordonnés. 


es modèles Probit et Logit ordonnés 


Dans un modèle ordonné, les modalités de la variable à expliquer sont hiérar- 
chisées. Elles indiquent l’appartenance de l’individu à une classe ou à une caté- 
gorie, par exemple l’appartenance à une tranche de revenu. 


Nous pouvons distinguer deux classes de modèles à choix multiples ordon- 
nés en fonction de la variable à expliquer qui est issue, soit d’une « discrétisa- 
ton » d’une variable continue telle que l’appartenance à une tranche de salaire, 
soit directement d’une appartenance à une catégorie (faire du sport : une fois par 
semaine, une fois par mois, une fois par an, ...). 


1 


Comme pour le modèle de choix binaire nous modélisons une variable 


latente continue : 
LA = do + Xi + Ei. 
Les valeurs prises par la variable y; correspondent à des intervalles dans les- 
P P y, P 
quels se trouve y* définissant ainsi le modèle de décision suivant à M + 1 moda- 
lités : 
y =0siy<c 
= Ilsic < y <C 
Yi = 28iC < }} < C3 


= M SicCy < ÿ* 
Soit P, la probabilité d’apparition de chaque événement pour l’individu à : 


Po = Prob(y; = 0) = P(c; — (as + aix) 
P: = Prob(y; = 1) = P(c — (ao + aixi) — Pc: — (ao + axi)) 
Pa = Prob(y; = 2) = P(c; — (ao + aixi) — PC — (ao + axi)) 


Piu = Prob(y; = M) = 1 — D(cy — (ao + &ixi)) 


1. Afin d’alléger l’écriture nous ne faisons figurer qu’une seule variable explicative, la généralisa- 
tion à & variables ne pose aucun problème comme l’illustre l’exercice n°2. 
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Avec ® la fonction de répartition de la loi de probabilité normale ou logis- 


e' ff 
et P, = 1 


Comme pour le modèle de choix binaire, le recours à une fonction de répar- 
tition normale, permet de définir un modèle de type Probit et une fonction de 
répartition de type logistique permet de définir un modèle Logit. L’estimation de 
tous les paramètres, les coefficients de régression (a;) et les valeurs des seuils 
(c:) des modèles ordonnés (Probit ou Logit) est effectuée à l’aide des algo- 
rithmes de maximisation d’une fonction de Log-vraisemblance définie par les 
P; 


tique (eu = 


je 

Les valeurs des coefficients des modèles ne sont pas directement interpré- 
tables en termes de propension marginale, seuls les signes des coefficients indi- 
quent si la variable agit positivement ou négativement sur la variable latente. 


Les résultats d’estimation s’apprécient de la même manière que pour les 
modèles de choix binaires : 


— la significativité des coefficients à l’aide des ratios z-Sfatistique, 

— la significativité globale de l’ajustement (l'hypothèse : HO : a; = a; = a; 
=...— a —=0) par la statistique LR = —2(Ln(Le) — Ln(Ly)) qui suit, 
sous l’hypothèse nulle HO, une distribution d’un x? à k degrés de liberté. 
Log(Lu) 


Le pseudo-R? est donné par : R°? = 1 — ———. 
Log(Lae) 


Exercice n° 2 


LL fichier C12EX2 


Estimation d’un modèle à choix multiples de prévision des ventes 


La société Télé-Ventes (ventes par téléphone lors d’une émission à la télévision) 
désire estimer le niveau des ventes par article pour chaque émission afin de dimension- 
ner la charge de l’entrepôt et prévoir ainsi le nombre d’équipes. 

L'émission est diffusée tous les jours sauf le dimanche. Les ventes sont réparties en 
trois classes : faible, moyenne, forte. 

L'objectif est d’estimer un modèle permettant de prévoir à quelle classe de vente 
(faible, moyenne, forte) appartient un article présenté lors d’une émission. Pour ce faire, 
on dispose des informations suivantes sur 82 émissions passées : 

VENTES : classe de l’article (faible = 0, moyenne = 1, forte = 2), 

WE : variable indicatrice du type de jour de diffusion de l’émission (1 les jours de 
semaine, 0 le samedi), 

EXPO : temps d’exposition du produit en minutes, 

REDUC : % de réduction proposé sur le prix, 

DIRECT = variable indicatrice d'émission enregistrée (0 pas direct, 1 direct). 


Un extrait des données est présenté dans le tableau 2. 
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Tableau 2 — Extrait de données 


Obs VENTES WE EXPO REDUC DIRECT 
1 0 1 35 0,20 0 
2 1 0 3,5 0,20 0 

81 1 7 0 

82 1 355 0 


1) On demande d’estimer un modèle Logit multinomial permettant de prévoir la classe 
de vente d’un article à partir des facteurs explicatifs proposés. 


2) D’effectuer une prévision pour un article présenté lors d’une émission en différé dif- 
fusée en semaine dont le temps d’exposition est de 7 minutes et sans réduction. 


Solution 


1) Une première estimation à l’aide d’un modèle de type Logit conduit au résultat 


suivant : 


Dependent Variable : VENTES 


Method: ML — Ordered Logit (Quadratic hill climbing) 


Included observations: 82 after adjusting endpoints 


Coefficient Std. Error z-Statistic Prob. 
DIRECT 0.226809 1.325269 0.171142 0.8641 
EXPO 0.644804 0.150121 4.295228 0.0000 
REDUC 8.922215 2.759073 3.233772 0.0012 
WE — 1.395159 0.512093 — 2.724426 0.0064 


Nous constatons que la variable DIRECT dont le coefficient est affecté d’une proba- 
bilité critique de 0,86 n’est pas significative (les téléspectateurs ne sont pas sensibles aux 
émissions diffusées en direct), elle est donc retirée du modèle. La nouvelle estimation est 


alors la suivante. 


Dependent Variable : VENTES 


Method: ML — Ordered Logit (Quadratic hill climbing) 


Included observations: 82 after adjusting endpoints 


Coefficient Std. Error z-Statistic Prob. 
EXPO 0.641023 0.148189 4.325700 0.0000 
REDUC 8.982926 2.735164 3.284237 0.0010 
WE — 1.377785 0.500824 — 2.751038 0.0059 
Limit Points 

LIMIT_1:C(4) 3.679581 0.994565 3.699689 0.0002 
LIMIT _2:C(5) 6.170926 1.174856 5.252497 0.0000 
Akaike info criterion 1.605306 Schwarz criterion 1.752057 
Log likelihood — 60.81754 Hannan-Quinn criter. 1.664224 
Restr. log likelihood  — 79.48219 Ave. log likelihood — 0.74167 
LR statistic (3 df) 37.32930 LR index (Pseudo-R2) 0.234828 

Probability(LR stat) 3.92E-08 
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a) Interprétation statistique 


Les coefficients sont maintenant tous significativement différents de O (probabilités 
critiques inférieures à 0,05). 


La statistique de la Log vraisemblance est égale à LR = 37,33 que l’on compare à un 
x? lu dans la table à un seuil de 0,95 % et à 3 degrés de liberté, x? 7 < 37,33 — rejet 
de HO. 


Le modèle est donc validé sur le plan statistique. 
b) Interprétation économique 


La durée d’exposition et le pourcentage de réduction agissent positivement sur les 
ventes. 


Une émission diffusée un jour de semaine engendre moins de ventes qu’une émis- 
sion diffusée le samedi. 


Les seuils c, et c> sont respectivement de 3,679 et 6,170. 
Les signes des coefficients sont conformes à l’intuition économique. 


Le logiciel Eviews propose une table permettant d'appréhender les qualités prévi- 
sionnelles du modèle sur l’échantillon : 


Dependent Variable : VENTES 

Method: ML -— Ordered Logit (Quadratic hill climbing) 
Included observations: 82 after adjusting endpoints 
Prediction table for ordored dependent variable 


Count of obs Sum of all 
Value Count with Max Prob Error Probabilities Error 
0 44 47 — 3 44.381 — 0.381 
1 27 31 —4 26.834 0.166 
2. 11 4 7 10.785 0.215 


À la lecture des résultats, nous constatons que les qualités prévisionnelles de ce 
modèle sont satisfaisantes car le taux d’erreur est assez faible pour les ventes de niveau 
0 et 1. En revanche, pour les ventes de niveau 2 (forte) nous constatons que sur 11 ventes 
réalisées, le modèle en a prévues correctement seulement 4. 


Enfin pour chaque individu Eviews indique : 


VENTES_0_0 = la probabilité associée à la modalité O, 
VENTES_1_0 = la probabilité associée à la modalité 1, 
VENTES_2_0 = la probabilité associée à la modalité 2, 


I_VENTES _0 = la réalisation de l’estimation de la variable latente. 


Un exemple est donné! pour les cinq premières ventes : 


1. Un exemple de calcul est détaillé lors de la réponse à la question 2. 
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obs VENTES  |VENTES_0 0 | VENTES_1_0| VENTES 2 0 I VENTES _0 
1 0 0.7342647 0.2366418 0.0290935 2.663212 
2 1 0.4106169 04831615 0.1062216 4.040996 
3 0 0.4106169 04831615 0.1062216 4.040996 
4 2 0.4106169 04831615 0.1062216 4.040996 
s) 1 0.7342647 0.2366418 0.0290935 2.663212 


2) Nous calculons l’estimation de la variable latente correspondante aux caractéristiques 
de l’émission avec EXPO = 7, REDUC = 0 et WE = 1 : 


ÿ* = 0,641 x EXPO + 8,982 x REDUC — 1,377 x WE 
* = 0,641 x 7 + 8,982 x O0 — 1,377 x 1 — 3,109 


Puis nous calculons les probabilités : 
Pi = Prob(y; = 0) = D(c; — x;à) = (3,679 — 3,109) 


e0:57 


P> = Prob(y; = 1) = (ce — x;à) — D(c1 — x;à) = P(6,17 — 3,109) — 0,639 


3,06 


e 
P2 = ®(3,06) — 0,639 — Te — 0,639 = 0,955 — 0,639 = 0,31 


P3 = Prob(y; = 2) = 1 — (6,17 — 3,109) = 1 — 0,955 = 0,045 


Soit les résultats suivants : 


VENTES = 1 
0,316 


VENTES =2 
0,045 


| VENTES = 0 
P, | 0,639 


Les ventes de l’émission prévue ont 64% de probabilité d’appartenir à la classe 0 de 


faible vente. 


e modèle de choix multiples non ordonné : 
le Logit multinomial 


Dans les modèles non ordonnés la variable à expliquer représente les possibili- 
tés de choix d’un individu parmi M + 1 possibilités et donc ses préférences, 


c’est pourquoi on les dénomme aussi modèle à utilités aléatoires. 


Soit l’utilité! de l’individu à pour la possibilité j(j = 0,1,...,M) : 


U;; = ao + aix; +6; 


1. Afin d’alléger l’écriture nous ne faisons figurer qu’une seule variable explicative, la généralisa- 
tion à k variables ne pose aucun problème. 
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La décision y; = j est retenue si U;; = Max(Uo,U;1,... Um). 


La loi des utilités peut être normale (Probit multinomial) ou log-normale 
(Logit multinomial). 


Dans le cas le plus fréquent d’un modèle Logit multinomial à M + 1 moda- 
lités, la probabilité du choix j pour l’individu i est donnée! par : 


| exp(x;a;) 1 
Prob(y; = j) = ET = 
>: exp(x;æ)  1+ >> exp(x; (ay — 4;) 
k=0 k=0 
k#j 


Avec x; le vecteur des caractéristiques de l’individu à et a; le vecteur carac- 


téristique de la modalité j. 


Dans un modèle Logit multinomial, la probabilité d’apparition de la jè® 


modalité dépend de la différence a; — a;, nous pouvons donc poser sans restric- 
tion 4 = 0. 

Par exemple, prenons le cas d’un individu ; qui a trois choix (M = 2), les 
probabilités s’écrivent : 


1 
Prob( = 0) = ; - 
À + xpQ@ — &)) + expQ/(@ — &)) 
1 
Prob(y; = 1) = - - 
1 + exp(x;(@o — &1)) + exp(x; (a — ai)) 
1 
Prob(y; = 2) 


— 1 +expt/(@ — &)) + expQ/ (a — &)) 


2 
Or, par construction ) P, = 1 et comme nous avons posé la contrainte 
i=0 
ao = 0, nous pouvons estimer les deux paramètres a, et a; qui s’interprètent 
comme étant des écarts par rapport au paramètre &o. 


Une autre caractéristique fondamentale du Logit multinomial réside dans la 
propriété d’indépendance — par rapport aux autres événements — du rapport des 
deux probabilités associées à deux possibilités j et k : 


Prob(y; = j) _ exp(xia;) 


Prob(y; = k&)  exp(x;&) = exp(xi(a; — a)) 


Ce rapport est indépendant des possibilités autres que j et k, cette hypothèse 
s’appelle l’indépendance des alternatives non pertinentes « /ndependance of 


1. Cf. Thomas A. (2002), pages 92-93. 
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Irrelevant Alternative ». Cette propriété est vérifiée! si le fait de changer l’en- 
semble des choix (par exemple ajouter une possibilité) ne modifie pas les ratios 
de chances. 

L’estimation des paramètres du modèle est effectuée à l’aide des algorithmes 
de maximisation de la fonction log-vraisemblance. Les valeurs des coefficients 
ne sont pas directement interprétables en termes de propension marginale, seuls 
les signes des coefficients indiquent si la variable agit positivement ou négati- 
vement sur la probabilité relative de choisir j plutôt que 0. 


Les résultats d’estimation s’apprécient de la même manière que pour les 
autres modèles : 


— la significativité des coefficients à l’aide des ratios z-Stratistique, 

— la significativité globale de l’ajustement (l’hypothèse : HO : a; = a, = a; 
=...= da, =0) par la statistique LR = —2(Ln(L») — Ln(Ly)) qui suit, 
sous l’hypothèse nulle HO, une distribution d’un x? à k degrés de liberté. 
Log(Lu) 


Le pseudo-R? est donné par : R? = 1 — —— 
Log(Lz) 


es modèles à variable dépendante 
limitée : le modèle Tobit 


Dans les modèles à variable dépendante limitée (« limited dependent variable 
models ») les valeurs de la variable à expliquer continue ne sont observables que 
sur un intervalle donné. Par exemple : 


— La demande d’un produit n’est connue (les ventes observées) que si le 
magasin possède ce produit en stock, au-delà la demande non satisfaite (les 
ventes perdues) est inconnue. 

— Le salaire d’un jeune diplômé n’est observable que si il travaille (salaire 
> 0). 

— Lors d’une enquête sur les dépenses relatives à l’achat de biens d’équipe- 
ment, seules les dépenses des ménages ayant effectivement acheté un bien 
d’équipement sont prises en compte. 

— etc. 

Le recours à l’économétrie des variables qualitatives se justifie par l’estima- 
tion de la probabilité que la variable à expliquer se trouve à l’intérieur de l’in- 
tervalle pour lequel elle est observable. Ces modèles, appelés modèle Tobit par 
référence à J. Tobin?, ont connu beaucoup d’extensions, nous pouvons citer : 


1. Cf. Thomas A. (2002), pages 101-103. 
2. Tobin J. (1958). 
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— le modèle censuré et le modèle tronqué (modèle Tobit simple) qui font 
seuls l’objet d’une présentation dans le cadre de ce manuel, 


— le modèle de sélection (modèle Tobit généralisé), 


— le modèle avec censure et sélection. 


e modèle Tobit simple : 
modèle de régression tronqué ou censuré 


Définitions préliminaires : 


— Une distribution est tronquée si les valeurs de la variable à expliquer et des 
variables explicatives ne sont pas observables lorsque les valeurs de la 
variable à expliquer dépassent un intervalle. 


— Une distribution est censurée si seules les valeurs de la variable à expliquer 
ne sont pas connues lorsqu'elles sortent d’un intervalle. 


Soit une variable latente y* — donc non systématiquement observable — et des 
variables explicatives x;, le modèle s’écrit de manière classique comme dans le 
cas des modèles à choix discrets : y* = x;a +e; avec : 


x, la matrice des valeurs des variables explicatives, 
a les coefficients du modèle, 
e; le terme d’erreur avec &; —> (N(0,0?) et donc y* —> N(x;a,o?). 
Les valeurs observées de la variable explicative y; sont données par : 
= y; Si y; > 0 
( =0siy; <0 


Lorsque les valeurs de y* sont nulles ou négatives, y; est égale à O mais l’on 
connaît néanmoins les valeurs des variables explicatives. Les données dans ce 
type de modèle sont dites censurées à gauche, y; suit alors une loi normale cen- 
surée. 


Comme pour les moindres carrés ordinaires : 
E(yÿ) = xia mais E(y;/y; > 0) Æ xia et E(y:) £ xia. 


En effet, calculons l’espérance de y; dans le cas d’un modèle censuré à 
gauche, non pas à O0, mais à une valeur seuil égale à c;, le modèle s’écrit : 


a 
= Gsiy <C 


y" = x;a + 6; avec &, —> N(0,0?). 
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L’espérance a pour expression : 
EG) = Prob(y; = 1) x E(y/y; = 1) + Prob(y; > ©) x E(yi/y: > ci) 


Soit ® la fonction de répartition de la loi de probabilité des erreurs (norma- 
le ou logistique) et @ la fonction de densité associée. Nous avons : 


YË — X;a Ci — X;a Ci — X;a 
Prob(y; = c1) = Prob(y* < c1) = Prob < = | ————— 
o 


© © 


1 C; — X;a C, — X;a 
Prob(y; > c;) = Prob(y; = yf) = —® = 1—-D| —— 
o o Oo 


E(y;/y =G)=c 


EGi/y > ©) = EG*/y* > ci) = (se +0 : _. or) £ x;a 


Soit : 


et. (<<) _…. l - (=) 
© © 


bla — xa)/o] ) _ 
1—®(a—xa)/o1) 


[4] 


x (se+o 


Le recours à la méthode des moindres carrés n’est donc pas possible. 
Le modèle de Tobit peut alors s’écrire de la manière suivante. 


En posant ÿ* = xà le modèle estimé de la variable latente et en effectuant les 
termes du deuxième membre de [4] et après simplification, nous obtenons l’écri- 
ture suivante : 


= x (Ca — ÿ)/o) + (A — D((c — ÿ)/o) > 0) 


+ 2e | gs [S] 
X O5 x (— Pc — ÿ)/0)) +0 x (bc — ÿ:)/o))) 

Plus généralement, et par extension, 1l est possible de formaliser un modèle 
de Tobit avec censure à gauche et censure à droite tel que : 


M=CG Si  <C 
HM=} Si CG << 


= C2 Si C1< 


Avec c, et c, deux valeurs numériques qui représentent les seuils de censure, 
l’une de ces valeurs peut être égale à co, si il n’existe pas de seuil à droite ou à 
gauche. 


Dans le cas particulier où c, = 0 et c, = co, nous retrouvons le modèle cano- 
nique de Tobit. 
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Le modèle de Tobit à deux seuils s’écrit à l’aide d’une démonstration ana- 
logue à la précédente : 


ÿi = x 

Yi = Qi X Dci — ÿ})/o) + © x (1 — P((c2 — Ÿ})/0)) 
+ (D((c2 — ÿ})/0) — P((ci — ÿ})/0) > 0) 
X (SF x (D((c2 — #)/o) — P((c1 — )/o)) + o 
X (—@((c — )/o) + b((c1 — ÿ)/0))) 


[6] 


stimation et interprétation des résultats 


La méthode des moindres carrés ordinaires n’est pas adaptée du fait de l’appa- 
rition fréquente, dans les observations de la variable à expliquer, des valeurs 
seuils. L’estimation des paramètres (a et o) du modèle est effectuée à l’aide d’un 
algorithme de maximisation de la fonction de la Log-vraisemblance. 


Les résultats d’estimation s’apprécient directement par la significativité des 
coefficients à l’aide des ratios appelés z-Sfatistique. 


Les valeurs des coefficients du modèle estimé sont directement interprétables 
en termes de propension marginale sur y*, du fait de la continuité dans l’inter- 
valle des seuils de la variable à expliquer. 


EXercice n° 3 


LL: fichier C12EX3 


Prévision de la demande d’électricité pour un fournisseur à capacité 
limitée 

Dans le cadre de l’ouverture du marché de l’électricité à destination des industriels, 
un fournisseur d'électricité, qui n’est pas l’opérateur historique, propose de l’énergie 
électrique à bas prix dans la limite de ses capacités fixées à 3 000 mégawatts : la deman- 
de supérieure à ce seuil ne peut donc pas être servie. 


Au-delà de ses capacités les clients sont délestés et sont donc dans l’obligation de 
basculer vers une autre source. La demande (y,) exprimée en mégawatts à la période f 
est fonction de trois facteurs explicatifs : 


X1, = indicateur d’écart de prix par rapport à la concurrence en f, la valeur indique 
le % de réduction, pour le jour considéré, accordé par l’opérateur historique (si 0 pas de 
réduction de prix), 


x = nombre de clients industriels alimentés en f, 


x3, = variable indicatrice signalant les jours particuliers à forte consommation tels 
que le lendemain de jour férié, 
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Soit les données quotidiennes sur 60 jours (cf. un extrait dans le tableau 3) dont cet 
opérateur dispose. 


Tableau 3 — Extrait de données 


Jour y X1 X2 X3 
1 2717 0 61 0 
2 2126 0 32 0 

59 2683 0,1 61 0 
60 3000 0 79 0 
61 1 98 1 
62 0 60 0 


On demande : 


1) d’estimer un modèle Logit permettant de prévoir la demande quotidienne à partir des 
facteurs explicatifs proposés et de commenter les résultats ; 


2) de comparer les résultats avec l’estimation par la méthode, non adaptée, des moindres 
carrés ordinaires ; 


3) d’effectuer une prévision pour les jours 61 et 62 sachant que : 
Xe = 1 Xe = 98 ; x361 = 1 et X1,62 = 0 ; X2,62 = 60 ; x3,62 = 0. 


Solution 


1) La consommation est censurée car les valeurs de la variable à expliquer (la demande) 
ne sont pas connues lorsqu'elles sortent de l’intervalle [0 ; 3 000] puisque au-delà de 
3 000, la demande ne peut être satisfaite. 


Equation Estimation 


Specficaton | Opbons 
Equabon spscilicalion Détnbution 
Le Fperdans vaisble followed by Est ol regressors ©Noma 
val 243 © > 
© Logstic 
© Extrere 
Value 
Dependet vanable censorng ponts 
Entei 2 mmbel, à see, à seres Left & Right ponts entered as 
cresson, or blank for no censcrrg ® Actual cenroring value 
Let [0 O Zero/one indcater of censcsing 
Right 300 [1 Truncatsd sample 
Estrmation setlings 
Methoct [CENSORED + Censcred or lruncated data (tobi] * | 
Senpk: |1 60 | 


OK. Ennule 


Figure 1 — Fenêtre de paramétrage pour un modèle Tobit (logiciel Eviews) 
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Pour estimer le modèle Tobit, le logiciel Eviews (cf. figure 1) permet de paramétrer 
les seuils de censure à gauche (c1 = 0) et à droite (c2 = 3000) et de choisir la distribu- 
tion de l’erreur (ici normale). Nous ne sélectionnons donc pas l’option distribution tron- 
quée puisque la distribution est censurée. 


Les résultats d’estimation sont les suivants : 


Dependent Variable : Y 

Method: ML -— Censored Normal (TOBIT) (Quadratic hill climbing) 
Included observations: 60 after adjustments 

Left censoring (value) series: 0 

Right censoring (value) series: 3000 


Coefficient Std. Error z-Statistic Prob. 
X1 — 27.69316 7.582649 — 3.652175 0.0003 
X2 20.50361 0.480937 42.63261 0.0000 
X3 186.2357 34.88046 5.339256 0.0000 
C 1473.642 23.60984 62.41642 0.0000 
Error Distribution 

SCALE: SIG 47.41983 4.617038 10.27062 0.0000 
R-squared 0.981952 Mean dependant var 2542.667 
S.E. of regression 46.09561 Akaiïke info criterion 9.355239 
Sum squared resid 116864.3 Schwarz criterion 9.529768 
Log likelihood — 275.6572 Hannan-Quinn criter 9.423507 

Ave. log likelihood | — 4.594286 
Left censored obs 0 Right censored obs 8 
Uncensored obs 52 Total obs 60 


a) Interprétation statistique 


Les coefficients sont tous significativement différents de 0 (les probabilités critiques 
des coefficients sont toutes inférieures à 0,05), le modèle est validé sur le plan statistique. 


Eviews indique, sur l’avant dernière ligne, le nombre de données censurées : 0 à 
gauche et 8 à droite. 


b) Interprétation économique 


— L’indicateur d’écart de prix agit négativement sur la demande : en cas de réduction 
tarifaire de la concurrence, la demande diminue. 


— Le nombre de clients connectés au réseau et la variable muette « type de jour » ont 
un effet positif sur la demande. 


— La variable d’échelle (estimateur de o) est égale à 47,41. 
Les coefficients ont bien le signe attendu, le modèle est validé sur le plan économique. 


Le modèle Tobit s’écrit d’après [6] : 


PE = —27,69 x x17 + 20,50 x 22, + 186,23 x x3: + 1473,64 
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y = 0 x D((0 — ÿ*)/47,41) + 3000 x (1 — P((3000 — ÿ*)/47,41)) 
+ (D((3000 — ÿ*)/47,41) — D((0 — ÿ*)/47,41) > 0) 
x (5 x (D((3000 — ÿ*)/47,41) — D((0 — ÿ*)/47,41)) 
+ 47,41 x (—((3000 — ÿ*)/47,41) + D((0 — ÿ*)/47,41))) 


avec ® la fonction de répartition de la loi normale et @ la fonction de densité associée. 


Les graphiques (cf. graphique 4) de la série brute et de la série ajustée présentent la qua- 
lité de l’ajustement : les valeurs sont limitées par le seuil maximum, soit 3 000 mégawatts. 
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— Demande -=- Demande ajustée 


Graphique 4 — Séries brute et ajustée de la variable (y,) demande (Modèle Tobit) 


2) L'application de la méthode des moindres carrés ordinaires conduit aux résultats sui- 
vants : 


Dependent Variable : Y 
Method: Least Squares 
Included observations: 60 after adjustments 


Variable Coefficient Std. Error t-Statistic Prob. 
X1 — 31.95356 11.44578 — 2.791732 0.0072 
X2 17.83772 0.659615 27.04260 0.0000 
X3 156.0019 60.45055 2.580653 0.0125 
C 1594.516 34.80522 45.81254 0.0000 
R-squared 0.941213 F-statistic 298.8649 
Sum squared resid 380662.1 Prob(F-statistic) 0.000000 


Les coefficients du modèle, tous significativement différents de 0, sont biaisés. Nous 
constatons que les valeurs estimées des coefficients sont légèrement différentes, bien que 
de même signe, de celles des valeurs estimées à l’aide du modèle Tobit. 
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Les graphiques (cf. graphique 5) de la série brute et de la série ajustée indiquent que 
l’utilisation de la méthode des MCO peut fournir des valeurs estimées parfois supérieures 
à 3 000 mégawatts ce qui est techniquement impossible. 
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—#-Demande -=- Demande ajustée 


Graphique 5 — Séries brute et ajustée de la variable (y,) 
demande (Méthode MCO) 


3) Le calcul de la prévision pour les jours 61 et 62 est directement effectué par applica- 
tion du modèle Tobit estimé. 


Sachant que : 
Xe = Lx = 98 ; x361 = 1 et x1,62 = 0 ; X2,62 = 60 ; X3,6 = 0. 
La prévision pour le jour 61 est donnée par : 
Ye = —27,69 x 1 + 20,50 x 98 + 186,23 x 1 + 1473,64 = 3641,53 
Y& > © — Ya = C2 = 3000 


La prévision pour le jour 62 est donnée par : 
y = —27,69 x 0 + 20,50 x 60 + 186,23 x 0 + 1473,64 = 2703,85 
C1 < Yé < C2 — Yo = Ye = 2703,85 


Le calcul de la prévision à l’aide du modèle estimé par la méthode des MCO conduit 
à des résultats légèrement différents comme l’illustre le tableau 4. 


Tableau 4 - Comparaison des prévisions par le modèle Tobit 
et par la méthode des MCO 


Jour Modèle Tobit MCO 
61 3000 3544,63 
62 2703,86 2687,26 
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ntroduction 
à l'économétrie 
des données 
de panel 


ans le chapitre 1 nous avons présenté les données de panel 

comme étant des modèles dans lesquels les variables représen- 

tent les valeurs prises par un échantillon d'individus à intervalle 
de temps réguliers. En économétrie nous pouvons nous intéresser à des 
données temporelles ou à des données en coupe instantanée, les don- 
nées de panel mélangent les deux dimensions : séries temporelles et don- 
nées en coupe. Les exemples sont nombreux : estimation économétrique 
entre les exportations et l'ouverture commerciale sur 20 ans (le temps) et 
15 pays (les individus), le revenu d'un échantillon de ménages sur plu- 
sieurs années, l'évolution du chiffre d'affaires de 30 grandes surfaces sur 
36 mois. L'intérêt de cette spécification réside dans la prise en compte 
d'un effet temporel et d'un effet individuel. 
Les individus sont l'unité statistique observée (consommateur, entreprise, 
région, pays, etc.) à intervalle de temps régulier. 
Dans ce chapitre, qui constitue une simple introduction à l'économétrie 
des données de panel!, nous présentons à la section | les modèles à don- 
nées de panel et la méthode d'estimation SUR ; puis en section Il, les tests 
d'homogénéité permettant de déterminer la structure du panel. Enfin la 
section Ill traite des panels à effets fixes et aléatoires, des méthodes d'es- 
timation et du test d'Hausman de spécification des effets individuels. 


1. Le lecteur désirant approfondir ce chapitre peut se référer à Sevestre P. 2002. 
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résentation des modèles à données 
de panel 


pécificités des données de panel 


1) Définitions préliminaires 


Les données de panel (ou données longitudinales) sont représentatives d’une 
double dimension : individuelle et temporelle. Un panel équilibré (balanced 
panel) a le même nombre d’observations pour tous les individus, un panel désé- 
quilibré (unbalanced panel) est un panel où il manque des observations pour 
certains individus. 


2) Exemple introductif 


Prenons un exemple introductif très simple, un panel composé de 2 individus 
(N = 2) et connu sur 3 périodes (T = 3), soit un total de N x T — 6 observa- 
tions à & = 2 variables explicatives. 


Le modèle général s’écrit : 
Vi = doi + dir + diXair + Er, 

y = Variable endogène observée pour l'individu à à la période f, 
Xi Xi = Variables explicatives observées pour l'individu à à l’instant r, 
a = terme constant pour l’individu i, 
&i,ax = coefficients des 2 variables exogènes pour l’individu à, 
e, — terme d’erreur pour l’individu à à la période f. 

Soit en l’écrivant pour l’ensemble des 6 observations! : 


Individu n° 1 Yi = do + dniXi2 + daXa2 + Er 


Yu = do + dix + daXon + En 
Yi = doi + duiXus + diXa3 + Es 


Individu n° 2 Yan = do + dirXi22 + AnXan + En 


Ya = do + diXin + AnXn1 + En 
Y23 = do2 + A12X123 + A2X223 + Es 


1. Nous constatons que nous avons 6 observations et 6 paramètres à estimer, l'objectif de cet 
exemple est simplement d'illustrer l’écriture d’un modèle en panel... 
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Sous forme matricielle le modèle s’écrit : 


Yi 1 0 x; 0 X211 0 doi Er 
Yi 1 O0 x; 0 X212 0 do2 E12 
Ya | 1 0 x; O0 x3 0 di 7 €13 
Ya On 200 HE 0 di E21 
Ya O 1 O0 x» 0 x» di En 
Ya3 O 1 O0 xs O0 x»; an E23 


S1 les hypothèses classiques sur les erreurs sont respectées (homoscédasticité et 
indépendance temporelle) et quelles sont indépendantes d’un individu à l’autre 
(Cov(&;,8;) = 0 pour i Æ j), nous pouvons appliquer la méthode des moindres 
carrés pour chacune des N équations relatives aux individus. Dans le cas où 
l'hypothèse d'indépendance entre les individus (Cov(s;, &;) = 05  O pour 
i £ j) n’est plus vérifiée, l’estimateur des MCO n’est plus BLUE, nous devons 
appliquer la méthode SUR (Seemingly Unrelated Regressions) de Zellner. 


a méthode SUR 


La méthode SUR, Seemingly Unrelated Regressions, de Zellner (1962) est utilisée 
lorsque les erreurs des équations individuelles sont corrélées : la covariance indivi- 
duelle Cov(&;,, 8) = ( £ 0 pour i Æ j. Les individus sont alors interdépendants. 
Cette méthode consiste à appliquer les MCG : asur = (X'R7!X) '(X'Q'Y) 


o?1 O1 es Oinl 
O1 o> 1 te OnÎ je > 
Avec Q  — , chaque élément 0;;1 étant de 
(NXT,NXT) ue RES 
On11 On es o21 


dimension (T,T). 
Pratiquement, la procédure est la suivante : 
— Estimation par les MCO des N équations individuelles. 


— Calcul des N résidus e;.. 


— Calcul des &? = = — et 6, = “= 
T T 


— Application des MCG : äsur = (X'Q 'X) '(X'@ 7). 


S1 les erreurs sont, de plus, autocorrélées dans le temps, la correction peut 
s’effectuer par une des méthodes présentées au chapitre 5. 
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La méthode d’estimation SUR présente l’avantage de prendre en compte 
l’hétérogénéité individuelle par l’intégration de la dépendance entre les indivi- 
dus mais présente l’inconvénient — surtout si le nombre d’observations tempo- 
relles T est faible — d’un grand nombre de paramètres à estimer : N x (k +1) 
coefficients et N x (N + 1)/2 éléments de la matrice Q. 


Les modèles à effets individuels fixes ou aléatoires permettent de trouver un 
compromis entre le nombre de paramètres à estimer et l’intégration de l’hétéro- 
généité individuelle. 


e modèle linéaire simple 


Le modèle en données de panel peut s’écrire pour N individus (i = 1,...,N) et 
T observations temporelles (1 = 1,...,7), soit n = N x T observations totales, 
de la manière suivante : 


Vi = oi + d'Xi + Er. 


variable endogène observée pour l’individu à à la période fr, 


Vir 
x;, = Vecteur des k variables exogènes x}, = (xis,Xar,... ,Xuir) ; xx eSt donc la 
valeur observée pour la k° variable exogène pour l’individu à à l'instant r, 
ax — terme constant pour l’individu à, 
a! = vecteur des k coefficients des k variables exogènes a! = (ai;,a»,...,ax), 
£ = terme d’erreur. 

À partir de cette spécification générale nous pouvons envisager quatre possi- 
bilités. 
Cas n° 1 : homogénéité totale. 


Les constantes a, et les coefficients a! sont tous identiques pour tous les indivi- 
dus, nous avons 45 = & et a; = a’ pour toutes les valeurs de i. Le modèle ne 
comporte qu’une seule équation estimée sur n = N x T observations empilées 
par les MCO (ou les MCG selon la structure de la matrice des variances et cova- 
riances des erreurs). 


Cas n° 2 : hétérogénéité totale. 


Les constantes a; et les coefficients a; sont tous différents pour toutes les 
valeurs de i, la structure en panel est rejetée. Le modèle doit être estimé équa- 
tion par équation pour les N équations (une équation par individu) par les MCO 
(ou les MCG selon la structure de la matrice des variances et covariances des 
erreurs). 


Cas n° 3 : hétérogénéité des coefficients des variables explicatives et homogé- 
néité des termes constants. 


Les constantes a; sont toutes identiques (ao; = &) pour les individus, maïs les 
coefficients a; des variables explicatives sont différents pour chaque individu. 
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Comme au cas n° 2, le modèle doit être estimé sur les N équations (une équa- 
tion par individu) par les MCO (ou les MCG selon la structure de la matrice des 
variances et covariances des erreurs). 

Cas n° 4 : hétérogénéité des termes constants et homogénéité des coefficients 
des variables explicatives — le modèle à effets individuels. 

Les constantes a; sont différentes pour les individus, mais les coefficients a’ des 
variables explicatives sont constants pour les individus (a! = a’). Ce modèle est 
appelé « modèle à effets individuels » et nous le présenterons à la section III. 


es tests d'homogénéité 


rocédure séquentielle de tests 


Le choix de la spécification (homogénéité, hétérogénéité) est donc très impor- 
tant. Afin de déterminer la structure du panel, Hsiao (1986) propose une procé- 
dure séquentielle de tests (cf. graphique 1) permettant de définir le cas dans 


lequel nous nous situons. 
& H! :dj= dget a'=a', Vi | 


is 
H, rejetée 


1 
H, vraie 


Test H£ : a'=a", Vi Cas n°1 : Homogénéité totale 


Vi = dÿ+ 4 Xj+ £ 


CENT 2 ; 
H, rejetée H,, vraie 


Cas n°2 : Hétérogénéité totale 3 
ss ! Test H° : &; 
di = doi + dXi+ Ei 


[} 


= dj Vi 


dire 3 < 
H, rejetée H, vraie 


Cas n°4: Modèle à effets individuels Ces n°1 :Homogénéité totale 


Yi sa +da Xi+ êi 


7 = doi + 4 Xÿ+ êi 


Graphique 1 — Procédure séquentielle des tests 
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onstruction des tests 


Les tests d’hypothèse sont construits à partir des statistiques de Fisher (test de 
Wald de restrictions sur les coefficients). 


1) Test H, : doi —= do et a = a; Vi 


Ce test d’hypothèses jointes se ramène à un test de Fisher dont la statistique est 
donnée par : 
p, — (SCRa = SCR)/N - D&+D) 

TU SCR/(NXT-NK+I)) 


SCR,; = somme des carrés des résidus du modèle contraint sous l’hypothèse 
H}, soit à estimer par les MCO le modèle en empilant toutes les observations. Le 
degré de liberté est égal à : (N x T = nombre total d’observations) 
—(k +1 = nombre de coefficients à estimer). 


SCR = somme des carrés des résidus du modèle non contraint, elle est égale 
à la somme des N sommes des carrés des résidus des modèles estimés sur les T 


N 
observations de chaque équation individuelle, soit SCR = >, SCR,. Le degré de 
i=1 


liberté est donc la somme des N degrés de liberté de chaque équation estimée, 
N 
soit ddl = D (T—-(k+1)=N xXT-N(K+1). 
i=1 
Le degré de liberté du numérateur est donc égal à la différence des degrés de 
liberté de SCR.; et SCR : 


ddin = [(N x T}-(&+ DIN x T)-N(k+ D] = (N-D(& + D 


La statistique F; est à comparer à la valeur lue dans la table de Fisher aux 
degrés de liberté du numérateur et du dénominateur. Si F, > Fhnadar NOUS reje- 
tons l'hypothèse H! au seuil «. 


2)TestH2: a'=a Vi 


Ce test d’hypothèses jointes se ramène au test de Fisher dont la statistique est 
donnée par : 


pr, — (SCRa = SCRY/(N — D x) 
7 SCR/(NXT-N(K+I)) 


SCR: = somme des carrés des résidus du modèle contraint sous l’hypothèse 
H?, soit à estimer le modèle à effets fixes individuels. Le degré de liberté est égal 
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à (N x T = nombre d’observations) — (k + N — nombre de coefficients à esti- 
mer), nous estimons k coefficients et N termes constants. 


SCR = somme des carrés des résidus du modèle non contraint. Le degré de 
liberté du numérateur est donc égal à : 
ddin =[(N x T)-&k+ NJIHN x T)-N(k + D]=(N-D xk 


La statistique F, est à comparer à la valeur lue dans la table de Fisher aux 
degrés de liberté du numérateur et du dénominateur. Si F, > Fu aa NOUS reje- 
tons l’hypothèse H° au seuil «. 


3) Test H; : doi —= do Vi 


Ce test d’hypothèses jointes se ramène au test de Fisher dont la statistique est 
donnée par : 


_ (SCRa — SCRa)/(N — 1) 
7 SCRo/(N X(T —1)—k) 


3 


SCR:; = somme des carrés des résidus du modèle contraint sous l’hypothèse H°. 


SCR,; = somme des carrés des résidus du modèle contraint sous l’hypothèse 
H}. Le degré de liberté du numérateur est donc égal à : 


ddin =T[(N x T)-&k+ DIN x T)-(k + N)] = N-1 
La statistique F, est à comparer à la valeur lue dans la table de Fisher aux degrés 


de liberté du numérateur et du dénominateur. Si F3 > Féunaaas NOUS rejetons 
l'hypothèse HS au seuil «. 


Exercice n° 1 


LT fichier C13EX1 = données en panel 
C13EX1-E = données empilées 


Procédure séquentielle des tests d’homogénéité 


Nous nous intéressons à l’évolution des dépenses d’éducation sur 25 ans (variable à 
expliquer notée y) pour neuf pays. Les facteurs explicatifs proposés sont : 


— Xi, = évolution des dépenses militaires en milliers de dollars pour le pays i à l’an- 
née f, 
— X2, = évolution du PIB (Produit intérieur brut) en milliers de dollars pour le pays 


i à l’année f. 


Les variables sont toutes connues sur 25 ans. 
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Le modèle à étudier est donc : 
Ya = doi + dix + Ai + Ex pour i=1,...,Nett=1,...,7T 


avec N —9 pays et T — 25 années, le nombre total d’observations est donc 


n=NXxT=225. 


— y; = évolution des dépenses d’éducation en milliers de dollars pour le pays à à 
l’année f, 
— &;, = erreur de spécification pour le pays À à l’année f, ces erreurs répondent aux 


hypothèses classiques (homoscédasticité et indépendance temporelle) et sont indépen- 
dantes d’un individu à l’autre (Cov(£;,,€;,) = 0 pour i Æ j). 


Un extrait des données est présenté au Tableau 1. 


Tableau 1 — Extrait des données de l’évolution en dépenses d'éducation, militaires et 
du PIB pour 9 pays sur 25 ans 


Pays Année Vi Xtir Xoit 
1 1 512 3,15 25,92 
1 2 687 5,32 22,51 
1 
1 24 2 166 6,29 19,76 
1 25 1214 11,62 19,76 
2 1 74 8,47 35,99 
2 2 67 11,37 17,8 
2 
2 24 5 2,66 12,43 
2 25 3 4,11 11,13 
3 1 419 5,81 13,61 
3 2 10238 7,02 3,27 
3 
3 24 1 939 12,83 14,27 
3 25 2 254 16,7 14,14 
9 23 5 6,05 8,77 
9 24 28 4,84 12,96 
9 25 170 3,87 12,83 


On demande d’appliquer la stratégie des tests d’homogénéité afin de déterminer la 
structure du panel. 
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Solution 


Nous commençons par tester l'hypothèse H} : a = ao et a’ = a! Vi. 


Soit à calculer : SCR,;, — somme des carrés des résidus du modèle contraint sous 
l'hypothèse Hi, nous estimons par les MCO le modèle en empilant toutes les observa- 
tions (fichier de données C13EX1-E). 


Les résultats sont les suivants : 


Dependent Variable: Y 
Method: Least Squares 
Included observations: 225 


Variable Coefficient Std. Error t-Statistic Prob. 
C 146.2167 138.0735 1.058977 0.2908 
X1 29.32698 13.82629 2.121103 0.0350 
X2 21.51258 11.47806 1.874234 0.0622 


SCR:1 = 233 782 555,085 ; degré de libertés — 225-3 — 222. 


Puis à calculer SCR — somme des carrés des résidus du modèle non contraint, elle 


est égale à la somme des 9 sommes des carrés des résidus des modèles estimés sur les 
N 


équations individuelles, soit SCR = > SCR;. 
i=1 
Les résultats sont les suivants, le programme Eviews est en téléchargement 
(C13EX1.PRG) : 


Pays Somme des carrés des résidus 
1 2757 341 
2 211 063,8 
3 84 306 563 
4 82 876 299 
5 150 121,7 
6 7 419 022 
7 2 771 928 
8 2 793 154 
9 297 885,1 

Total SCR 183 583 378 


À titre d'exemple, l’estimation pour le deuxième pays (individu n° 2) est la sui- 
vante : 
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Dependent Variable: Y 
Sample: 26 50 
Included observations: 25 


Variable Coefficient Std. Error t-Statistic Prob. 
C 58.36178 47.94892 1.217166 0.2364 
X1 — 0.180573 6.411318 — 0.028165 0.9778 
X2 0.506402 2.722052 0.186037 0.8541 


Sum squared resid 211063,8 Degré de liberté = 25 — 3 = 22 


SCR = 183 583 378,162 ; degré de libertés = 9 x (25-3) — 198. 
_ (SCRa — SCR)/(N — D(K+1) _ (233782555,08 — 183 583 378,162)/24 


Fi = = 
ï SCR/(NXT—-N(k+1) 183 583378,162/198 
2091 632,372 0.05 : ; k 
— 027188,7786 — 2,25, Fi > Fi.jog = 1,52, nous rejetons l’hypothèse HY. 
Nous nous dirigeons vers la branche de gauche du graphique 1, soit à tester : H : 
a'= a; Vi. 


Nous calculons SCR, — somme des carrés des résidus du modèle contraint sous 
l'hypothèse H}, soit à estimer le modèle à effets fixes individuels (la méthode d’estima- 
tion sera étudiée à la section III, fichier de données C13EX1). 


Dependent Variable: Y? 


Method: Pooled Least Squares 
Sample: 1 25 


Included observations: 25 


Cross-sections included: 9 


Total pool (balanced) observations: 225 


Variable Coefficient Std. Error t-Statistic Prob. 

C 654.9109 181.7605 3.603153 0.0004 

X1? — 49,50377 23.64297 — 2.093805 0.0375 

X2? 22.17142 11.02105 2.011733 0.0455 

Fixed Effects (Cross) 

_1-C 49.20967 

_2-C — 438.3058 

_3-C 1 157.176 

_4-C 102.6206 

_5-C — 409.4617 

_6-C 794.9591 

_7-C — 273.2759 

_8-C — 501.3735 

_9-C — 481.5489 SCR: = 195 511 374,365 
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Le degré de liberté de ce modèle est de 225 — 2 — 9 — 214, car la constante ao = C 
— 654,91 est la moyenne des 9 coefficients des effets fixes. 


7, — (SCRa — SCRY/(N — D) X&k _ (233782555.08 — 195511 374,365)/16 
27 SCR/NXT-NUG+D — 183 583 378,162/198 
74 599,762 7 


7 927188,7786 
nous dirigeons donc vers la branche de droite du graphique 1. 


= 0,804, FE > EU = 1,90, nous acceptons l’hypothèse H3. Nous 


Test H : doi = 4 Vi 
SCRe — SCRe)/(N — 1 . 
Soit à calculer la statistique : F; = ( : 2) ) dont nous connais- 
sons tous les éléments. SCRo2/(N X (T —1)—k) 


Fr, — (233782555,08 — 195511 374,365)/8 _ 4783 897,589 | 
LE 195 511 374,365/213 7 917893,7764 


5,24, 


B > Fe % 1,90 nous rejetons l’hypothèse H$. 


Le panel à une structure à effets individuels. 


pécifications et estimations des modèles 
à effets individuels 


Les modèles à effets individuels supposent que les modèles estimés ne diffèrent par 
individu que par la valeur de la constante ao; = ao + ai. Nous allons distinguer deux 
cas : les modèles à effets fixes (l’effet individuel est constant au cours du temps) et 
les modèles à effets aléatoires (le terme constant est une variable aléatoire). 


Les modèles à effets individuels peuvent être transposés au modèle à effets 
temporels, la constante s’écrit alors ao = ao + a, (cf. Sevestre P., 2002). 


e modèle à effets fixes individuels 


Le modèle en données de panel à effets fixes individuels peut s’écrire de la 
manière suivante : 


Yi = doi + d'Xi + Er 
y = Variable endogène observée pour l’individu à à la période f, 


x; = Vecteur des k variables exogènes x°, = (Xis,%25r,... ,Xuir) 5 Xi St donc la 
valeur observée pour la k—i° variable exogène pour l'individu à à l’instant r, 


as = terme constant pour l’individu à, 
a’ = vecteur des k coefficients des k variables exogènes, a’ = (ai,@,...,@), 


£ = terme d’erreur. 
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La méthode d’estimation des paramètres va dépendre de la structure des 
termes d’erreurs : 


— Si les erreurs sont homoscédastiques, non autocorrélées dans la dimension 
temporelle Cov(s;,8;,) = 0 pour ft Æ r’ et dans la dimension individuelle 
Cov(&;,,8;,) = 0 pour i Æ j : méthode des Moindres Carrés Ordinaires 
(MCO) sur les variables indicatrices (en anglais LSDV = Least Square 
Dummy Variable) ou sur les estimateurs Wifhin. 


— Si les erreurs sont hétéroscédastiques et/ou autocorrélées dans la dimen- 
sion temporelle mais indépendantes dans la dimension individuelle : 
méthode des Moindres Carrés Généralisés (MCG) sur les variables indica- 
trices (LSDV) ou sur les estimateurs Within. 


1) Estimateur LSDV 


L’estimateur LSDV consiste à appliquer la méthode des MCO sur le modèle 
avec variables indicatrices spécifiques pour chacun des N individus. Nous 
construisons donc N variables indicatrices tel que : D, = 1 pour l'individu à et 
0 pour les autres. 


Le modèle s’écrit : y; + ao + an Di + ao D +... + aon Dy + d'xi + 8 


Pratiquement, nous estimons le modèle sans la constantel &: 
Ya = D; +a&D, +...+a, D, + a'x, +8; par les MCO ou les MCG si les 
erreurs sont hétéroscédastiques ou/et autocorrélées. 

Nous pouvons ensuite calculer les coefficients ao = à + a; du modèle ini- 


tial, la valeur de la constante a, étant égale à la moyenne des coefficients a; esti- 
més. 


2) Estimateur Within 


L’estimateur Within (estimateur intra-individuel) consiste à centrer préalable- 
ment toutes les variables à expliquer et explicatives sur leurs moyennes indivi- 
duelles et à appliquer la méthode des MCO (ou MCG si les erreurs sont hété- 
roscédastiques ou autocorrélées) sur le modèle ainsi transformé : 


(a — Y,) = a'(xi — Xi) + 6, pour i =1,...,N ett =1,...,T. 
Après l’estimation des coefficients a’ les coefficients fixes individuels a; s’ob- 
tiennent par les relations : âo = y, — 4'X1 ; do = Y2 — 4'X2 ; ... ; don = Yy — d'XN 


Nous calculons ensuite les coefficients av = ay + a; du modèle initial 
comme précédemment. 


Cette méthode d’estimation conduit exactement aux mêmes résultats que la 
méthode LSDV. 


1. Sinon, il y aurait alors colinéarité entre le vecteur du terme constant (ao) et la somme des N 
variables indicatrices, la matrice (X’X) serait alors singulière (non inversible). 
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e modèle à effets aléatoires 


1) Présentation du modèle à effets aléatoires 


Le modèle à effets aléatoires suppose que la relation entre la variable à expliquer 
et les variables explicatives ne soit plus fixe mais aléatoire, l’effet individuel 
n’est plus un paramètre fixe a; mais une variable aléatoire. 


Le terme d’erreur se décompose de la manière suivante : &;, = ao; + À; + v; 
d’où le nom donné aussi à ce type de modèle : modèle à erreur composée (error 
components model). 


Les a représentent les effets individuels aléatoires, la variable aléatoire À, 
représente les effets temporels identiques pour tous les individus et enfin v;, est 
un terme d’erreur qui est orthogonal aux effets individuels et temporels. 


En outre, nous faisons les hypothèses suivantes concernant les variables aléa- 
toires &w, À et v; : espérances nulles, homoscédasticités, indépendance tempo- 
relle et orthogonalité entre les trois composantes. 


Dans le cas simple où l’effet temporel n’existe pas (À, = 0), le modèle à effets 
aléatoires individuels s’écrit alors : y;, = ao + a'x;, + 8;, avec &;, = am + và. 


Ou encore y;, = &o + ay + 4’x;, + v,. Le coefficient a, est un coefficient fixe 
identique pour tous les individus. 


2) Estimation du modèle à effets aléatoires 


La méthode d’estimation adéquate est celle des MCG car la composante aléa- 
toire a est présente dans &,, et &;, d’où Cov(e;,, 87) Æ 0. Nous avons donc une 
autocorrélation des erreurs (cf. Sevestre 2002). 


On démontre que l’estimateur des MCG se ramène à une moyenne pondérée 
des estimateurs Within (présenté précédemment) et Between. L’estimateur 
Between (estimateur inter-individuel noté az.) est l’estimateur des MCO appli- 
qué sur le modèle dont les données sont les N moyennes individuelles des 
variables à expliquer et explicatives : 


ÿ, = 40 + do + a'X; + v, pour i = 1,...,N. 
L’estimateur des MCG! est donné par : @ycç = Aüge + (1 — A)&;spy 


La valeur des poids À, une matrice de dimension (k,k), est inversement pro- 
portionnelle à la matrice des covariances de as. 


L'introduction d’effets individuels aléatoires permet donc de combiner une 
spécification intermédiaire entre le modèle sans effet individuel et le modèle 
avec effets fixes. La structure du panel n’est ni totalement homogène, ni totale- 
ment hétérogène. 


1. On démontre aussi que l’estimateur des MCO sur les données empilées se ramène aussi à une 
moyenne pondérée des estimateurs Within et Between. 
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ffets fixes ou effets aléatoires ? Le test d'Hausman 


Le test d’Hausman (cf. chapitre 5) est un test de spécification qui permet de 
déterminer si les coefficients des deux estimations (fixes et aléatoires) sont sta- 
tistiquement différents. 


Sous l’hypothèse nulle HO d’orthogonalité entre les variables explicatives et 
le terme d’erreur du modèle à effets aléatoires, les deux estimateurs —- Within et 
MCG -— sont des estimateurs non biaisés et dans ce cas il ne doit pas y avoir de 
différence significative entre les estimations Within et MCG des différents coef- 
ficients. La méthode des MCG est alors retenue : le modèle est à effets aléa- 
toires. 


Soit le test d’hypothèses : 
HO: Gispv — ayce = 0 —> le modèle est à effets aléatoires 
H1: Gsnv — amcc Æ 0 —> le modèle est à effets fixes 
Nous calculons la statistique : 
H — (azspv — auce) [Var(azspv) Er Var(awcc)l  (aispv F= aucc) 


La statistique H est distribuée selon un chi-deux à k degré de liberté. Si 
H > x°(k) pour un seuil a « % fixé, nous rejetons l’hypothèse HO, l’estimateur 
LSDV (Within) est non biaisé, nous rejetons alors la spécification à effets aléa- 
toires et nous choisissons un modèle à effets fixes individuels. 


Exercice n° 2 


+, fichiers C13EX1, C13EX1-E 


Estimation du modèle à effets fixes individuels et à effets aléatoires 
individuels, estimateur Between, test d’Hausman 


En reprenant le modèle et les données de l’exercice n° 1, on demande : 
1) D’estimer le modèle à effets fixes individuels. 

2) D’estimer le modèle à effets aléatoires individuels. 

3) De calculer l’estimateur Between. 


4) De procéder au test d’Hausman. 


Solution 


1) Nous créons les neuf variables indicatrices relatives à chacun des pays et nous procé- 
dons à l’estimation par les MCO du modèle (hors terme constant) sur les données empi- 
lées (fichier C13EX1-E) : 
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Ye = diXi + xx + biDi, + DD: +... + boDo, + 8, 


Soit le résultat suivant : 


Dependent Variable: Y 


Sample: 1 225 


Included observations: 225 


Variable Coefficient Std. Error t-Statistic Prob. 
X1 — 49,50377 23.64297 — 2.093805 0.0375 
X2 22.17142 11.02105 2.011733 0.0455 

DUMI 704.1205 240.8149 2.923907 0.0038 

DUM2 216.6050 250.8295 0.863555 0.3888 

DUM3 1 812.087 340.8004 5.317151 0.0000 

DUM4 757.5315 227.2174 3.333951 0.0010 

DUMS 245.4491 232.6545 1.054994 0.2926 

DUM6 1 449.870 429.0331 3.379390 0.0009 

DUM7 381.6349 224.4928 1.609987 0.0906 

DUMB8 153.5374 215.6064 0.712119 0.4772 

DUM9 173.3620 234.4385 0.739477 0.4604 


Nous calculons maintenant les coefficients a; = &o; — &o : 


Pays doi di 
1 704,12 49,21 
2 216,61 — 438,31 
3 1 812,09 1 157,18 
4 757,53 102,62 
5 245,45 — 409,46 
6 1 449,87 794,96 
7 381,63 — 273,28 
8 153,54 — 501,37 
9 173,36 — 481,55 
Moyenne = a 654,91 


Nous retrouvons bien exactement les mêmes résultats que lors du calcul de la 
SCRa2 = somme des carrés des résidus du modèle contraint sous l’hypothèse H2 de l’exer- 
cice n° 1 (fichier de données C13EX1, instruction Eviews : panel.ls(ex =f) y? x1? x2?). 


2) L’estimation du modèle à effets aléatoires individuels est effectuée par l’instruction 
Eviews : panel.Ils(cx =R) y? x1? x2? 


Les résultats sont les suivants : 
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Dependent Variable: Y? 


Method: Pooled EGLS (Cross-section random effects) 


Sample: 1 25 


Included observations: 25 


Cross-sections included: 


9 


Total pool (balanced) observations: 225 


Cross-section SUR (PCSE) standard errors & covariance (d.f. corrected) 


Variable Coefficient Std. Error t-Statistic Prob. 

(@ 400.3119 208.0501 1.924112 0.0556 

X1? — 9.907703 22.74786 — 0.435544 0.6636 

X2? 21.70457 11.17599 1.942071 0.0534 

Random Effect (Cross) 

_1-C 76.20577 

_2-C — 326.3516 

_3-C 729.8104 

_4-C 171.7304 

_5-C — 2797010 

_6-C 327.8098 

_7-C — 109.6655 

_8-C — 269.7585 

_9-C — 320.0798 


Nous observons que le modèle à effets aléatoires conduit à des estimations des coe- 
ficients très différents du modèle à effets fixes, cela peut provenir d’une corrélation entre 
les effets individuels et les variables explicatives qui introduit un biais d’estimation lors 
de l’application de la méthode des MCG. 


3) L’estimateur Between consiste à estimer par les MCO le modèle suivant : 
Yi = do + doi + Ad’; + V; 


Les moyennes calculées sur les 25 années pour les 9 individus sont présentées au 


tableau 2. 


Tableau 2 — Moyennes sur les 25 ans par pays 


Pays Yi Xi Xi 
1 602,00 5,26 7,13 
2 60,64 6,15 6,69 
3 1 330,56 11,76 4,54 
4 769,68 3,49 8,33 
5 70,20 5,31 3,96 
6 842,72 15,85 7,99 
7 403,88 3,22 8,20 
8 175,00 2,70 7,00 
9 81,44 4,85 6,68 
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Les résultats de l’estimation Between (application des MCO sur les données du 
tableau 2) sont les suivants avec pour variable à expliquer y; : 


Coefficients | Écart-type | t-Statistique | Probabilité 
Constante — 125,65 694,52 — 0,183 0,86 
Xi 62,93 32,29 1,94 0,09 
Xi 29,41 92,22 0,318 0,76 


4) Nous calculons la statistique d’Hausman : 


H = (aispv — amce) [Var(@rspv) — Var(amce)l \(azspv — amcc) 


Avec : 
_ —49,503 ne —9,907 = 558,99 —2,30 
ALSDV — | | ; — | | ; Var( azspv) = | | ; 
22,171 21,704 —2,30 121,46 
= 361,49 0,566 
Var(amcc) = | | 
0,566 119,71 
ee _ —39,59 _ A 197,50 —2,869 
(azspv — amcc)= | | ; [Var(azspv)— Var(aucc)]= | | 
0,466 —2,869 1,751 


0,00518  0,84997 Fr —39,59 
H =1[-39,59 0,466] | | | 


| = 7,94 > x?(2) pour un 
0,8499 0,585 0,466 


seuil de 5 % = 5,99. 
Nous rejetons l’hypothèse HO, le modèle est donc à effets individuels fixes. 


Le programme Eviews en téléchargement (C13EX2) permet de calculer directement 
la statistique d’Hausman. 
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ste des exercices 


Chapitre 1 
Exercice 1 — Calcul d’un coefficient de corrélation 
Chapitre 2 
Exercice 1 — Génération d’une consommation aléatoire 
Exercice 2 — Estimations des coefficients de régression 
Exercice 3 — Test de coefficient et intervalle de confiance 
Exercice 4 — Équivalence des tests et analyse de la variance 
Exercice 5 — Prévision dans un modèle de régression simple 
Exercice 6 — Comparaison de coefficients de régression 
Exercice 7 — Apprendre à manipuler les formules 
Exercice 8 — Apprendre à utiliser les formules 
Chapitre 3 
Exercice 1 — Mise sous forme matricielle d’un modèle 
et calcul des coefficients de régression 
Exercice 2 — Tests statistiques sur les coefficients et la variance de l’erreur : 
calcul des leviers et des résidus studentisés 
Exercice 3 — Tests à partir de l’analyse de la variance 
Exercice 4 — Détection et correction de valeurs anormales 
par variable indicatrice 
Exercice 5 — Intégration d’une variable qualitative 
Exercice 6 — Étude de saisonnalité par variables indicatrices 
Exercice 7 — Prévision à partir du modèle linéaire 
Exercice 8 — Tests de stabilité structurelle, test de spécification de Ramsey 
Exercice 9 — Estimation d’un modèle et tests de validité à partir de 


la connaissance de quelques éléments statistiques 


Exercice 10 — Test d’une combinaison linéaire de coefficients de régression 


(test de contrainte linéaire) 


Exercice 11 — Reconstitution d'informations manquantes 


10 


15 
20 
29 


36 
41 


43 
44 
45 


55 


64 
69 


76 
78 
79 
83 


87 


90 


93 
95 
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Exercice 12 — Modèle à deux régimes : estimation par variable muette 


ou par analyse de la variance 


Exercice 13 — Estimation d’une fonction de production : impact de la 
privatisation 

Exercice 14 — Fonction économétrique d’investissement 

Chapitre 4 

Exercice 1 Calcul des coefficients de corrélation partielle du premier ordre 


Exercice 2 


Exercice 3 
Exercice 4 


Exercice 5 


Chapitre 5 


Exercice 1 


Exercice 2 


Exercice 3 


Exercice 4 


Exercice 5 


Exercice 6 


Exercice 7 


Chapitre 6 


Exercice 1 


Exercice 2 


Exercice 3 


et du deuxième ordre 


Relation entre coefficients de corrélation simple, partielle 
et multiple 


Conséquences de la multicolinéarité 
Tests de multicolinéarité 


Méthodes de sélection de variables explicatives 


Tests d'indépendance des erreurs 


Procédures d’estimation en cas d’autocorrélation 
des erreurs d’ordre 1 


Correction de l’hétéroscédasticité 
lorsque les données représentent des moyennes 


Tests de détection d’une hétéroscédasticité et correction 


Test d’exogénéité d’Hausman, modèle à erreurs sur 
les variables : la technique des variables instrumentales 


Prévision de part de marché 


Un peu de réflexion économétrique.. 


Estimation d’une fonction de production de type Cobb-Douglas 


Estimation des paramètres d’un modèle de diffusion 
Logistique et de Gompertz 


Estimation des paramètres d’une fonction de production 
de type CES 
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96 


97 
101 


109 


113 
114 
117 
121 


131 


139 


144 
147 


158 
160 
162 


165 


172 


174 


Chapitre 7 


Exercice 1 — Estimation des paramètres d’un modèle autorégressif 


Exercice 2 
Exercice 3 
Exercice 4 
Exercice 5 


Exercice 6 
Exercice 7 


Exercice 8 


Chapitre 8 


Exercice 1 


Exercice 2 


à erreurs liées 


Détermination du nombre de retards dans un modèle 
à retards échelonnés 


Estimation des coefficients à l’aide d’un polynôme 
(méthode d’ Almon) 


Estimation des coefficients d’un modèle selon une spécifica- 
tion des retards de Koyck et une distribution de Pascal 


Estimation d’un modèle d’ajustement partiel 
et d’anticipations adaptatives 


Modélisation du prix d’une matière première 
Un modèle d’évaluation de la politique marketing 


Une comparaison des courbes de Phillips française et américaine 


Comparaison des résultats par moindres carrés ordinaires, 
moindres carrés indirects et doubles moindres carrés 


Le problème de l’identification lorsque la structure 
d’un modèle change 


Exercice 3 — Le modèle de Klein 


Chapitre 9 
Exercice 1 — Exemple d’application des tests de racine unitaire au CAC40 
Exercice 2 — Génération de processus ARMA 
et analyse des corrélogrammes 
Exercice 3 — Analyse par la méthode de Box et Jenkins et prévision de 


Chapitre 10 


Exercice 1 
Exercice 2 


Exercice 3 


Exercice 4 


trois processus aléatoires 


Recherche des conditions de stationnarité d’un modèle VAR 
Spécification, estimation et prévision d’un modèle VAR 


Analyse d’une fonction de réponse impulsionnelle 
et décomposition de la variance 


Tests de causalité de Granger et de Sims 


181 


186 


191 


195 


200 
201 
203 
208 


225 


229 
230 


252 


260 


264 


278 
281 


290 
293 
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Chapitre 11 


Exercice L — 


Exercice 2 — 


Chapitre 12 


Exercice 1 — 


Exercice 2 — 


Exercice 3 — 


Chapitre 13 


Exercice L — 


Exercice 2 — 


Test de cointégration et estimation d’un modèle 
à correction d’erreur 


Tests de cointégration et estimation d’un modèle vectoriel 
à correction d’erreur 


Estimation des modèles Probit et Logit binaires explicatifs 
des facteurs de la réussite en Licence 


Estimation d’un modèle à choix multiples de prévision 
des ventes 


Prévision de la demande d’électricité pour un fournisseur à 
capacité limitée 


Procédure séquentielle des tests d’homogénéité 


Estimation du modèle à effets fixes individuels et à effets 
aléatoires individuels, estimateur Between, test d’Hausman 
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314 


326 
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ables statistiques 


1. Table de la loi de Laplace-Gauss 

2. Table de la loi de Student 

3. Table de la loi du Chi-Deux 

4. Table de la loi de Fisher-Snedecor 

5. Table de la loi de Fisher-Snedecor (suite) 
6. Table de Durbin-Watson 

7. Tables de Dickey-Fuller 
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1. TABLE DE LA LOI DE LAPLACE-GAUSS 
(Probabilité de trouver une valeur inférieure à x) 


1 fo 2, 
at) = —— el"/?dt. 


V27 


[ee] 


0,01 


0,02 


0,03 


0,04 0,05 0,06 0,07 


0,08 


0,09 


0,7881 
0,8159 


0,9713 


0,9772 
0,9821 
0,9861 
0,9893 
0,9918 
0,9938 
0,9953 
0,9965 
0,9974 
0,9981 


0,5040 
0,5438 
0,5832 
0,6217 
0,6591 
0,6950 
0,7290 
0,7611 
0,7910 
0,8136 


0,8438 
0,8665 
0,8869 
0,9049 
0,9207 
0,9345 
0,9463 
0,9564 
0,9649 
0,9719 


0,9779 
0,9826 
0,9864 
0,9896 
0,9920 
0,9940 
0,9955 
0,9966 
0,9975 
0,9982 


0,5080 
0,5478 
0,5871 
0,6255 
0,6628 
0,6985 
0,7324 
0,7642 
0,7939 
0,8212 


0,9783 
0,9830 
0,9868 
0,9898 
0,9922 
0,9941 
0,9956 
0,9967 
0,9976 
0,9982 


0,5120 
0,5517 
0,5910 
0,6293 
0,6664 
0,7019 
0,7357 
0,7673 
0,7967 
0,8238 


0,8485 
0,8708 
0,8907 
0,9082 
0,9236 
0,9370 
0,9484 
0,9582 
0,9664 
0,9732 


0,9788 
0,9834 
0,9871 
0,9901 
0,9925 
0,9943 
0,9957 
0,9968 
0,9977 
0,9983 


0,5160 | 0,5199 | 0,5239 | 0,5279 
0,5557 | 0,5596 | 0,5636 | 0,5675 
0,5948 | 0,5987 | 0,6026 | 0,6064 
0,6331 | 0,6368 | 0,6406 | 0,6443 
0,6700 | 0,6736 | 0,6772 | 0,6808 
0,7054 | 0,7088 | 0,7123 | 0,7157 
0,7389 | 0,7422 | 0,7454 | 0,7486 
0,7704 | 0,7734 | 0,7764 | 0,7794 
0,7995 | 0,8023 | 0,8051 | 0,8078 
0,8264 | 0,8289 | 0,8315 | 0,8340 


0,8508 | 0,8531 | 0,8554 | 0,8577 
0,8729 | 0,8749 | 0,8770 | 0,8790 
0,8925 | 0,8944 | 0,8962 | 0,8980 
0,9099 | 0,9115 | 0,9131 | 0,9147 
0,9251 | 0,9265 | 0,9279 | 0,9292 
0,9382 | 0,9394 | 0,9406 | 0,9418 
0,9495 | 0,9505 | 0,9515 | 0,9525 
0,9591 | 0,9599 | 0,9608 | 0,9616 
0,9671 | 0,9678 | 0,9686 | 0,9693 
0,9738 | 0,9744 | 0,9750 | 0,9756 


0,9793 | 0,9798 | 0,9803 | 0,9808 
0,9838 | 0,9842 | 0,9846 | 0,9850 
0,9875 | 0,9878 | 0,9881 | 0,9884 
0,9904 | 0,9906 | 0,9909 | 0,9911 
0,9927 | 0,9929 | 0,9931 | 0,9932 
0,9945 | 0,9946 | 0,9948 | 0,9949 
0,9959 | 0,9960 | 0,9961 | 0,9962 
0,9969 | 0,9970 | 0,9971 | 0,9972 
0,9977 | 0,9978 | 0,9979 | 0,9979 
0,9984 | 0,9984 | 0,9985 | 0,9985 


0,5319 
0,5714 
0,6103 
0,6480 
0,6844 
0,7190 
0,7517 
0,7823 
0,8106 
0,8365 


0,8599 
0,8810 
0,8997 
0,9162 
0,9306 
0,9429 
0,9535 
0,9625 
0,9699 
0,9761 


0,9812 
0,9854 
0,9837 
0,9913 
0,9934 
0,9951 
0,9963 
0,9973 
0,9980 
0,9986 


0,5359 
0,5753 
0,6141 
0,6517 
0,6879 
0,7224 
0,7549 
0,7852 
0,8133 
0,8339 


0,8621 
0,8830 
0,9015 
0,9177 
0,9319 
0,9441 
0,9545 
0,9633 
0,9706 
0,9767 


0,9817 
0,9857 
0,9890 
0,9916 
0,9936 
0,9952 
0,9964 
0,9974 
0,9981 
0,9986 


TABLE POUR LES 


GRANDES VALEURS DE X 


X 


3,0 


3,1 


3,2 


3,3 


3,4 3,5 3,6 3,8 


4,0 


4,5 


F(x) 


0,998 65 


0,999 04 | 0,999 31 


0,999 52 


0,999 66 | 0,999 76 | 0,999 8411 0,999 928 


0,999 968 


0,999 997 


Nota. — La table donne les valeurs de F(x) pour x positif. Lorsque x est négatif, il faut prendre le complé- 
ment à l'unité de la valeur lue dans la table. 


Exemples : pour x = 
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1,37 F(x) = 0,9147 
pour x = —1,37 F(x) = 0,0853 


2. TABLE DE LA LOI DE STUDENT 


Valeurs de T ayant la probabilité P d’être dépassées en valeur absolue 


P=0,90! 0,80 0,70 | 0,60 | 0,50 | 0,40 | 0,30 | 0,20 0,10 | 0,05 0,02 0,01 


4 


0,158 10,325 10,510 10,727 11,000 11,376 11963 13,078 16,314 112,706 131,821 (63,657 
0,142 10,289 (10,445 10,617 10,816 |1,061 |1,386 ,886 |2,920 |4,303 | 6,965 | 9,925 
0,137 |0,277 [0,424 10,584 10,765 10,978 |1,250 ,638 12,353 |3,182 |4,541 | 5,841 
0,134 10,271 [0,414 10,569 10,741 0,941 |1,190 533 |2,132 |2,776 | 3,747 | 4,604 
0,132 |0,267 [0,408 10,559 10,727 10,920 |1,156 476 |2,015 |2,571 | 3,365 | 4,032 
0,131 10,265 [0,404 10,553 10,718 10,906 |1,134 4440 ,943 |2,447 | 3,143 | 3,707 
0,130 10,263 [0,402 10,549 10,711 10,896 |1,119 415 ,895 |2,365 |2,998 | 3,499 
0,130 10,262 10,399 10,546 10,706 10,889 11,108 11,397 860 |2,306 | 2,896 | 3,355 
0,129 10,261 10,398 10,543 10,703 10,883 11,100 |1,383 833 |2,262 | 2,821 | 3,250 
0,129 10,260 10,397 10,542 10,700 [0,879 11,093 ,372 ,812 |2,228 |2,764 | 3,169 


OO DOI À © D 


+ 


110,129 10,260 10,396 10,540 10,697 10,876 11088 |1,363 ,196 |2,9201 |2,718 | 3,106 
210,128 10,259 10,395 10,539 10,695 10,873 11,083 11,356 782 |2,179 | 2,681 | 3,055 
1310,128 10,259 10,394 10,538 10,694 10,870 11,079 ,350 171 [2,160 | 2,650 | 3,012 
410,128 (0,258 10,393 10,537 10,692 10,868 |1,076 ,345 ,161 |2,145 | 2,624 |2,977 
510,128 10,258 10,393 10,536 10,601 10,866 |1,074 ,341 1753 |2,131 |2,602 | 2,947 
1610,128 10,258 10,392 10,535 10,690 10,865 11,071 ,337 ,146 |2,120 |2,583 | 2,921 
170,128 10,257 10,392 10,534 10,689 10,863 11,069 ]1,333 ,140  |2,110 |2,567 | 2,898 
810,127 |0,257 [0,392 10,534 10,688 10,862 |1,067 ,330 134 | 2,101 |2,552 | 2,878 
910,127 [0,257 10,391 10,533 10,688 [0,861 |1,066 ,328 ,729 |2,093 |2,539 | 2,861 
200,127 10,257 10,391 10,533 10,687 |0,860 11,064 ,325 ,125 |2,086 | 2,528 | 2,845 


210,127 [0,257 10,391 10,532 10,686 10,859 11,063 ,323 ,721 |2,080 |2,518 | 2,831 
2210,127 [0,256 10,390 10,532 10,686 |0,858 11,061 ,321 ,T17 | 2,074 | 2,508 | 2,819 
2310,127 [0,256 10,390 10,532 10,685 10,858 11,060 ,319 114 | 2,069 | 2,500 | 2,807 
2410,127 10,256 10,390 10,531 10,685 10,857 11,059 |1,318 111 | 2,064 | 2,492 | 2,797 
2510,127 [10,256 10,390 10,531 10,684 10,856 11,058 ,316 ,108 |2,060 | 2,485 | 2,787 
2610,127 10,256 10,390 10,531 10,684 10,856 11,058 ,315 106 |2,056 | 2,479 | 2,779 
2710,127 [10,256 10,389 10,531 10,684 10,855 11,057 ,314 103 |2,052 |2,473 |2,771 
2810,127 [10,256 10,389 10,530 10,683 10,855 11,056 ,313 ,101 |2,048 | 2,467 | 2,763 
2910,127 [0,256 10,389 10,530 10,683 10,854 11,055 |1,311 ,699 12,045 | 2,462 | 2,756 
300,127 10,256 10,389 10,530 10,683 10,854 11,055 |1,310 697 |2,042 | 2,457 | 2,750 


Do |0,12566 |0,25335 10,38532 |0,52440 |0,67449 [0,84162 |1,03643 |1,28155 |1,64485 | 1,95996| 2,32634] 2,57582 


Nota. — v est le nombre de degrés de liberté. 
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3. TABLE DE LA LOI DU CHI-DEUX 
Valeurs de y? ayant la probabilité P d’être dépassées 


P=0,90! 0,80 | 0,70 0,50 0,30 0,20 0,10 0,05 0,02 | 0,01 


Lol 


0,0158| 0,0642| 0,148 | 0,455] 1,074! 1,642 | 2,706| 3,841| 5,412] 6,635 
0,211 | 0,446 | 0,713 | 1,386| 2,408 | 3,219 | 4,605] 5,991] 7,824] 9,210 
0,584 | 1,005 | 1,424] 2,366] 3,665 | 4,642] 6,251] 7,815| 9,837 | 11,345 
1,064 | 1,649 | 2,195 | 3,357] 4,878 | 5,989 | 7,779] 9,488 | 11,668 | 13,277 
1,610 | 2,343 | 3,000 | 4,351] 6,064] 7,289 | 9,236 | 11,070 | 13,388 | 15,086 
2,204 | 3,070 | 3,828 | 5,348 | 7,231 | 8,558 | 10,645 | 12,592 | 15,033 | 16,812 
2,833 | 3,822 | 4,671 | 6,346] 8,383 | 9,803 | 12,017 | 14,067 | 16,662 | 18,475 
3,490 | 4,594 | 5,527 | 7,344] 9,524 | 11,030 | 13,362 | 15,507 | 18,168 | 20,090 
4,168 | 5,380 | 6,393 | 8,343 | 10,656 | 12,242 | 14,684 | 16,919 | 19,679 | 21,666 
10 | 4,865 | 6,179 | 7,267 | 9,342 | 11,781 | 13,442 | 15,987 | 18,307 | 21,161 | 23,209 
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111 5,578 | 6,989 | 8,148 | 10,341 | 12,899 | 14,631 | 17,275 | 19,675 | 22,618 | 24,725 
12 | 6,304 | 7,807 | 9,034 | 11,340 | 14,011 | 15,812 | 18,549 | 21,026 | 24,054 | 26,217 
13 | 7,042 | 8,634 | 9,926 | 12,340 | 15,119 | 16,985 | 19,812 | 22,362 | 25,472 | 27,688 
14 | 7,790 | 9,467 | 10,821 | 13,339 | 16,222 | 18,151 | 21,064 | 23,685 | 26,873 | 29,141 
15 | 8,547 110,307 | 11,721 | 14,339 | 17,322 | 19,311 | 22,307 | 24,996 | 28,259 | 30,578 
16 | 9,312 111,152 | 12,624 | 15,338 | 18,418 | 20,465 | 23,542 | 26,296 | 29,633 | 32,000 
17 [10,085 112,002 | 13,531 | 16,338 | 19,511 | 21,615 | 24,769 | 27,587 | 30,995 | 33,409 
18 10,865 112,857 | 14,440 | 17,338 | 20,601 | 22,760 | 25,989 | 28,869 | 32,346 | 34,805 
19 111,651 113,716 | 15,352 | 18,338 | 21,689 | 23,900 | 27,204 | 30,144] 33,687 | 36,191 
20 |12,443 |14,578 | 16,266 | 19,337 | 22,775 | 25,038 | 28,412 | 31,410 | 35,020 | 37,566 


21 113,240 115,445 | 17,182 | 20,337 | 23,858 | 26,171 | 29,615 | 32,671 | 36,343 | 38,932 
22 |14,041 |16,314 | 18,101 | 21,337 | 24,939 | 27,301 | 30,813 | 33,924 | 37,659 | 40,289 
23 |14,848 |17,187 | 19,021 | 22,337| 26,018 | 28,429 | 32,007| 35,172| 38,968 | 41,638 
24 115,659 |18,062 | 19,943 | 23,337 | 27,096 | 29,553 | 33,196] 36,415 | 40,270 | 42,980 
25 |16,473 |18,940 | 20,867 | 24,337 | 28,172 | 30,675 | 34,382 | 37,652 | 41,566 | 44,314 
26 |17,292 |19,820 | 21,792 | 25,336 | 29,246 | 31,795 | 35,563 | 38,885 | 42,856 | 45,642 
27 |18,114 |20,703 | 22,719 | 26,336 | 30,319 | 32,912 | 36,741 | 40,113 | 44,140 | 46,963 
28 |18,939 121,588 | 23,647 | 27,336 | 31,391 | 34,027 | 37,916 | 41,337 | 45,419 | 48,278 
29 |19,768 122,475 | 24,577 | 28,336 | 32,461 | 35,139 | 39,087 | 42,557 | 46,693 | 49,588 
30 120,599 123,364 | 25,508 | 29,336 | 33,530 | 36,250 | 40,256 | 43,773 | 47,962 | 50,892 


Lorsque v > 30, on peut admettre que la quantité /2 x? — 4/2 v — 1 suit la loi normale 
réduite. 
Exemple : 
Calculez la valeur de x? correspondant à une probabilité P = 0,10 de dépassement 
lorsque v = 41. À l’aide de la table 1, on calcule, pour P = 0,10, x = 1,2816. 

_ [x + V2 v — 1F 4 


1 
D'où: x à = ;[1.2816 + V82— IF = 7 (10.2816) = 52.85. 
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4. TABLE DE LA LOI DE FISHER-SNEDECOR 


Valeurs de F ayant la probabilité P d’être dépassées (F = 52/5) 


g 


. v = 1 vw =2 vw = 3 v, = 4 vw = 5 
2 
P=0,05|P=0,01|P=0,05|P=0,01|P=0,05/P=0,01|P=0,05|P=0,01|P=0,05 |P =0,01 
11161,4 14052 199,5 14999 215,7 |5403 224,6 |5625 230,2 5764 
2] 18,51 98,49| 19,00 99,00! 19,16] 99,17] 19,25] 99,25] 19,30 | 99,30 
3] 10,13 34,12 9,55 30,81 9,28 29,46 9,12 28,71 9,01 28,24 
41 7,71 21,20| 6,94 18,00 6,59 16,69 6,39 15,98| 6,26 | 15,52 
5! 6,61 16,26| 5,79 13,27 5,41 12,06 5,19 11,39, 5,05 | 10,97 
6| 5,99 13,74] 5,14 10,91 4,76 9,78 4,53 9,15] 4,39 8,75 
7] 5,59 12,25| 4,74 9,55 4,35 8,45 4,12 7,851 3,97 7,45 
8 5,32 11,26 4,46 8,65 4,07 7,59 3,84 7,01 3,69 6,63 
9! 5,12 10,56] 4,26 8,02 3,86 6,99 3,63 6,42] 3,48 6,06 
10] 4,96 10,04! 4,10 7,56 3,71 6,55 3,48 5,99! 3,33 5,64 
11 4,84 9,65 3,98 7,20 3,59 6,22 3,36 5,67 3,20 5,32 
12! 4,75 9,33| 3,88 6,93 3,49 5,95 3,26 5,41! 3,11 5,06 
13 4,67 9,07 3,80 6,70 3,41 5,74 3,18 5,20 3,02 4,86 
14! 4,60 8,86| 3,74 6,51 3,34 5,56 3,11 5,03] 2,96 4,69 
15! 4,54 8,68| 3,68 6,36 3,29 5,42 3,06 4,89, 2,90 4,56 
16 4,49 8,53 3,63 6,23 3,24 5,29 3,01 4,77 2,85 4,44 
17 4,45 8,40 3,59 6,11 3,20 5,18 2,96 4,67 2,81 4,34 
18 441 8,28 3,55 6,01 3,16 5,09 2,93 4,58 2,77 4,25 
19 4,38 8,18 3,52 5,93 3,13 5,01 2,90 4,50 2,74 4,17 
20 4,35 8,10 3,49 5,85 3,10 4,94 2,87 4,43 2,71 4,10 
21 4,32 8,02 3,47 5,78 3,07 4,87 2,84 4,37 2,68 4,04 
22 4,30 7,94 3,44 5572 3,05 4,82 2,82 4,31 2,66 3,99 
23 4,28 7,88 3,42 5,66 3,03 4,76 2,80 4,26 2,64 3,94 
24 4,26 7,82 3,40 5,61 3,01 4,72 2,78 4,22 2,62 3,90 
25 4,24 7,77 3,38 5,57 2,99 4,68 2,76 4,18 2,60 3,86 
26 4,22 7,72 3,37 5,53 2,98 4,64 2,74 4,14 2,59 3,82 
27 4,21 7,68 3,35 5,49 2,96 4,60 2,73 4,11 2,57 3,78 
28 4,20 7,64 3,34 5,45 2,95 4,57 2,71 4,07 2,56 3,75 
29 4,18 7,60 3,33 5,42 2,93 4,54 2,70 4,04 2,54 3,73 
30! 4,17 7,56| 3,32 5,39 2,92 4,51 2,69 4,02! 2,53 3,70 
40 4,08 7,31 3,23 5,18 2,84 4,31 2,61 3,83 2,45 3,51 
60 4,00 7,08 3,15 4,98 2,76 4,13 2,52 3,65 2,37 3,34 
120 3,92 6,85 3,07 4,79 2,68 3,95 2,45 3,48 2,29 3,17 
OO 3,84 6,64 2,99 4,60 2,60 3,78 2,37 3,32 2,21 3,02 
Nota. — 5? est la plus grande des deux variances estimées, avec v1 degrés de liberté. 
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5. TABLE DE LA LOI DE FISHER-SNEDECOR (suite) 


Valeurs de F ayant la probabilité P d’être dépassées (F = 52/5) 


g ff 


: v, = 6 V = 8 vw = 12 v, = 24 LV, = O0 
2 
P=0,05|P=0,01/|P=0,05|P=0,01|P=0,05|P=0,01|P=0,05|P=0,01|P=0,05 |P=0,01 
112340 15859 238,9 |5981 243,9 16106 249,0 16 234 254,3 16366 
21 19,33 99,33| 19,37 99,36| 19,41 99,42| 19,45 99,46| 19,50 | 99,50 
3 8,94 27,91 8,84 27,49 8,74 27,05 8,64 26,60 8,53 26,12 
4 6,16 15,21 6,04 14,80 5,91 14,37 5,77 13,93 5,63 13,46 
5 4,95 10,67 4,82 10,27 4,68 9,89 4,53 9,47 4,36 9,02 
6 4,28 8,47 4,15 8,10 4,00 7,72 3,84 7,31 3,67 6,88 
7] 3,87 7,19| 3,73 6,84 3,57 6,47 3,41 6,07| 3,23 5,65 
8 3,58 6,37 3,44 6,03 3,28 5,67 3,12 5,28 2,93 4,86 
9 3:37 5,80 3,23 5,47 3,07 5,11 2,90 4,73 2,71 4,31 
10 3,22 5,39 3,07 5,06 2,91 4,71 2,74 4,33 2,54 3,91 
11 3,09 5,07 2,95 4,74 2,79 4,40 2,61 4,02 2,40 3,60 
12 3,00 4,82 2,85 4,50 2,69 4,16 2,50 3,78 2,30 3,36 
13 2,92 4,62 2,77 4,30 2,60 3,96 2,42 3,59 2,21 3,16 
14 2,85 4,46 2,70 4,14 2,53 3,80 2,35 3,43 2,13 3,00 
15 2,79 4,32 2,64 4,00 2,48 3,67 2,29 3,29 2,07 2,87 
16 2,74 4,20 2,59 3,89 2,42 3,55 2,24 3,18 2,01 2,75 
17 2,70 4,10 2,55 3,79 2,38 3,45 2,19 3,08 1,96 2,65 
18 2,66 4,01 2,51 3,71 2,34 3,37 2,15 3,00 1,92 2,57 
19 2,63 3,94 2,48 3,63 2,31 3,30 2,11 2,92 1,88 2,49 
20 2,60 3,87 2,45 3,56 2,28 3,23 2,08 2,86 1,84 2,42 
21 2,57 3,81 2,42 3,51 2,25 3,17 2,05 2,80 1,81 2,36 
22 2,55 3,76 2,40 3,45 2,23 3,12 2,03 2,75 1,78 2,31 
23 2,53 3,71 2,38 3,41 2,20 3,07 2,00 2,70 1,76 2,26 
24 2,51 3,67 2,36 3,36 2,18 3,03 1,98 2,66 1,73 2,21 
25 2,49 3,63 2,34 3,32 2,16 2,99 1,96 2,62 1,71 2,17 
26 2,47 3,59 2,32 3,29 2,15 2,96 1,95 2,58 1,69 2,13 
27 2,46 3,56 2,30 3,26 2,13 2,93 1,93 2,55 1,67 2,10 
28 2,44 3,53 2,29 3,23 2,12 2,90 1,91 2592 1,65 2,06 
29 2,43 3,50 2,28 3,20 2,10 2,87 1,90 2,49 1,64 2,03 
30 2,42 3,47 2,27 3:17 2,09 2,84 1,89 2,47 1,62 2,01 
40 2,34 3,29 2,18 2,99 2,00 2,66 1,79 2,29 1,51 1,80 
60 2,25 3,12 2,10 2,82 1,92 2,50 1,70 2,12 1,39 1,60 
120 2,17 2,96 2,01 2,66 1,83 2,34 1,61 1,95 1,25 1,38 
O0 2,09 2,80 1,94 2,51 1,75 2,18 1,52 1,79 1,00 1,00 
Nota. — s? est la plus grande des deux variances estimées, avec v1 degrés de liberté. 
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6. TABLE DE DURBIN-WATSON 
Risque « =5 % 


15 | 1,08 1,36 | 0,95 1,54 | 0,82 1,75 | 0,69 1,97 | 0,56 | 2,21 
16 | 1,10 1,37 | 0,98 1,54 | 0,86 1,73 | 0,74 1,93 | 0,62 | 2,15 


18 | 1,16 1,39 1,05 1,53 0,93 1,69 | 0,82 1,87 | 0,71 2,06 
20 | 1,20 1,41 1,10 1,54 1,00 1,68 | 0,90 1,83 0,79 1,99 
22 | 1,24 1,43 1,15 1,54 1,05 1,66 | 0,96 1,80 | 0,86 1,94 
24 | 1,27 1,45 1,19 1,55 1,10 1,66 1,01 1,78 0,93 1,90 


26 | 1,30 1,46 1,22 1,55 1,14 1,65 1,06 1,76 | 0,98 1,88 


29 | 1,34 1,48 1,27 1,56 1,20 1,65 1,12 1,74 1,05 1,84 
31 | 1,36 1,50 1,30 1,57 1,23 1,65 1,16 1,74 1,09 1,83 
33 | 1,38 1,51 1,32 1,58 1,26 1,65 1,19 1,73 1,13 1,81 
35 | 1,40 1,52 1,34 1,58 1,28 1,65 1,22 1,73 1,16 1,80 
37 | 1,42 1,53 1,36 1,59 1,31 1,66 1,25 1,72 1,19 1,80 
39 | 1,43 1,54 1,38 1,60 1,33 1,66 1,27 1,72 1,22 1,79 
45 | 1,48 1,57 1,43 1,62 1,38 1,67 1,34 1,72 1,29 1,78 


55 | 1,53 1,60 1,49 1,64 1,45 1,68 1,41 1,72 1,38 1,77 


70 | 1,58 1,64 1,55 1,67 1,52 1,70 1,49 1,74 1,46 1,77 
80 | 1,61 1,66 1,59 1,69 1,56 1,72 1,53 1,74 1,51 1,77 


90 | 1,63 1,68 1,61 1,70 1,59 1,73 1,57 1,75 1,54 1,78 


100 | 1,65 1,69 1,63 1:72 1,61 1,74 1,59 1,76 1,57 1,78 


k est le nombre de variables exogènes (constante exclue). 
n est la taille de l’échantillon. 
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7. TABLES DE DICKEY-FULLER! 
Modèle [1] sans tendance et sans terme constant 
Modèle [2] sans tendance et avec terme constant 
Modèle [3] avec tendance et avec terme constant 


Tables de la distribution du f,, 


Nombre 


SE AtODS Probabilités 
n 0,01 0,025 | 0,05 0,10 0,90 0,95 | 0,975 | 0,99 
25 2,66 2,26 1,95 1,60 0,92 1,33 1,70 2,16 
50 2,62 2,25 1,95 1,61 0,91 1,31 1,66 2,08 


100 2,60 | - 2,4 1,95 |—1,61| 0,91) 1,29] 1,64| 2,03 : 
250 2,58 [223 |-195 |-162| 080! 120| 163| 201| Modèler] 
500 2,58 | —2,23 |—1,95 | —1,62| 0,89! 1,28| 1,62| 2,00 


00 2,58 2,23 | — 1,95 1,62 | 0,89 1,28| 1,62] 2,00 
25 3,75 3,33 | — 3,00 | — 2,63 | -0,37 0,00 | 0,34! 0,72 
50 3,58 3,22 | — 2,93 2,60 | — 0,40 0,03 | 0,29 | 0,66 


100 3,51 | —3,17 | - 2,89 | - 2,58 | 0,42 | 0,05! 0.26 | 0,63 . 
250 346 |-3141-288 |_257|-042|-006| 024| 0,62| Modèle [2] 
500 3,44 | - 3,13 | - 2,87 | 2,57 |-0,43 | -0,07| 024! 0,61 


oo |-343|-312|-286 |-257|-044|-007| 023| 0:60 
25 3,38 | — 3,95 [— 3,60 [3,24 [1,14 | — 0,80 | - 0,50 | -0,15 
50 415 | — 3,80 | — 3,50 | — 3.18 | — 1.19 | 0:87 |-0,58 | 0:24 


100 |-—4,04 | - 3,73 | 3:45 | - 315 | - 1:22 | — 0,90 | - 0,62 | - 0:28 . 
250 399 | _ 3:69 | — 343 | - 313 | 123 | 092-064 |-031| Modèle [3] 
500 3:98 | — 3.68 | — 3,42 | — 3,13 | — 1,24 | — 0:93 | — 0:65 | - 0,32 
oo | 3,96 | — 3,66 | — 3,41 | — 3,12 | — 1.25 | — 0,94 | 0,66 | - 0,33 


Tables de la distribution des fr; et f; (test bilatéral) 


Modèle [2] Modèle [3] 


Constante c Constante c Tendance b 


n 2% | 5% |10%| 2% | 5% |10%|2% | 5% |10%X 


25 3,41 | 2,97 | 2,61 | 4,05 | 3,59 | 3,20 | 3,74 | 3,25 | 2,85 


50 3,28 | 2,89 | 2,56 | 3,87 | 3,47 | 3,14 | 3,60 | 3,18 | 2,81 


100 | 3,22 | 2,86 | 2,54 | 3,78 | 3,42 | 3,11 | 3,53 | 3,14 | 2,79 


250 | 3,19 | 2,84] 2,53 | 3,74 | 3,39 | 3,09 | 3,49 | 3,12 | 2,79 
500 | 3,18 | 2,83 | 2,52 | 3,72 | 3,38 | 3,08 | 3,48 | 3,11 | 2,78 


CO 3,18 | 2,83 | 2,52 | 3,71 | 3,38 | 3,08 | 3,46 | 3,11 | 2,78 


1. Source : Fuller W.A., Introduction to Statistical Times Series, John Wiley, 1976. 
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